查看原文
其他

Midjourney系列重磅更新全测评!一张AI图看完“瞬息全宇宙”

月山橘 头号AI玩家 2023-08-02

作者 | 月山橘‍
编辑 | 张洁
校对 | 卷毛

Midjourney的更新频率是真的快,简直是AI绘画届的“卷王”。

继Zoom Out、Custom Zoom等缩放填充功能之后,就在前天,Midjourney又推出了平移扩展功能Pan。‍‍

这些新功能兼具实用性和可操作性,今天我们经过一番实测,给玩家们献上这份最全测评,希望有用。


新功能:Outpainting(扩展绘图)

此前,PS的Generative Fill(生成填充)功能一开放内测,就被网友们玩疯了。

网络上流传的一些经典梗图被扩展后,毫无违和感,堪比原图:


也有一些图被扩展后,离谱中又夹杂着合理。



Stability AI旗下的图像编辑网站Clipdrop也上线了图像外延绘制功能Uncrop,直接对标Generative Fill,被称为PS AI的免费平替。


Midjourney V5.2版本推出的Zoom Out、Custom Zoom、Pan等功能,更是不遑多让。

下面是Midjourney各个扩图功能的具体实测:
 
1. Zoom Out

首先在“/seetings”中将Midjourney切换为V5.2版本:
 
 
常规输入关键词生成图片,然后选择其中一张放大。
 
 
放大后的图片下方会出现Zoom Out 2x和Zoom Out 1.5x选项,即缩放2倍和1.5倍,这里我选择的是Zoom Out 2x,来看看效果:
 
 
扩展后的图像风格、细节与原图非常统一,毫无违和感。理论上,重复以上操作,就可以无限扩展下去。
 
还有人将生成的扩展照片按缩放倍数排序,作为视频的关键帧图像,做出惊艳的无限宇宙效果。
 

 
不过,对于画面元素较为复杂,或主体不够突出、不易识别的图像,利用Zoom Out一键扩展可能会出现画面重复、混乱的情况。

比如下方这张扩展后的“阿尼亚工作照”,画面中出现了一群阿尼亚,就像阿尼亚来到了一家遍布“人工智能阿尼亚”的公司上班,画风透露着一丝怪异。

图源:小红书“头号AI玩家”

2. Custom Zoom
 
这个功能相当于Zoom Out的高级设置,允许自定义缩放倍数,并且支持在缩放图像的同时修改提示词和图片尺寸,来控制延伸场景的画面内容。
 
比如我生成了一张女孩的面部特写,想把它扩展为更完整的人像,就可以通过组合调整关键词、图片尺寸、缩放倍数来实现。
 
 
原图片尺寸为3:4,原关键词为:一个可爱的女孩、高清的面部特征、紧张的表情、极近特写、柔和的光线、8K画质(A cute girl, clear facial features, nervous expressions, hyper-realistic, ultra-detailed, extreme close-up, soft light, 8K)。‍‍
 
我调整为“穿着白色蕾丝裙的可爱女孩”,并删去了高清面部特征、特写等关键词,修改图片尺寸为16:9(--ar 16:9),设置缩放倍数为2倍(--zoom 2)。
 
 
然后就得到了下面这两张图片:
 
 
当然,你也可以持续套娃,继续缩放,并通过修改Prompt和图片尺寸来调整画面元素,这样一张局部特写轻轻松松就能变成一副丰富完整的画面。
 
3. Pan
 
Pan算是对Zoom Out和Custom Zoom功能的补充。它可以定向扩展图片,如水平扩展或垂直扩展,而不是像Zoom Out一样按特定比例对全图进行缩放填充。
 
以这张猫咪拟人图为例,图片下方有⬅️➡️⬆️⬇️四个箭头,即向左、右、上、下平移扩展。
 
 
我选择了向右平移,并修改图片尺寸为16:9,于是得到了下面这张图片:
 
 
这个效果着实让人有些惊喜,Midjourney版清明上河图恐怕指日可待了。‍

不过该功能目前还存在一些限制:
 
1. 用户只能水平或垂直平移扩展图像,一旦你选择水平扩展,后续生成的图片就不再支持垂直扩展;
 
2. 无法控制平移程度;
 
3. 平移扩展后的图像不再支持Make Variations;
 
4. 平移过程中依然可能会出现画面重复和简单的复制拼接,为避免这种情况,最好在平移时修改Prompt,描述平移后新增的画面内容。
 
4. Make Square
 
点击生成图片下方的“Make Square”选项,可以将非正方形图像变成正方形。如果想做头像,用这个功能就很方便。



新指令:Weird
 
这个指令可以让生成的图片更加前卫和怪异,取值范围支持0-3000,数值越大越离谱。
 
下面我们以关键词“DC joker”进行测试,小丑的形象本身就已经够怪异了,我倒要看看这个Weird指令还能怪出什么新高度。
 
先是--weird 0:
 
 
然后是--weird 100:
 
 
血液、残肢、邪恶的笑容……weird数值才100,画面就已经相当阴森诡异了,很难想象weird值达到3000,生成的会是什么怪力乱神……
 
几个小结论:
 
1. weird数值建议控制在1000以内,超过1000就不太可控了。

2. 添加weird指令后绘出的图多偏卡通,有点老旧的贴图风并且缺乏细节

3. 可以尝试和--stylize(风格化)命令一起使用,你很有可能得到一张“怪好看”的图,两者的数值一般建议相同。


新的出图模式:Turbo
 
这个模式的图片生成速度比Fast模式快4倍,但是会消耗2倍的Fast模式生成时间。
 
也就是说,在Fast模式下生成图片需要10秒,Turbo模式只需要2秒左右,但会消耗20秒的生成时长。
 


新的付费等级:Mega
 
这是Midjourney新推出的付费等级,一个月120美元,区别就是Fast模式生成时间增加至60小时,不过Turbo模式消耗的Fast时间不变,依然是2倍。
 

如果不具有多人、同时、大量出图的需求,60美元每月的套餐基本就够用了。‍


 
从扩展绘制图像的质量来看,Midjourney和PS的Generative Fill不相上下,无论是构图还是美学、风格,跟原图的适配程度都很高。至于哪个生成效果更强,很难一概而论。
 
不过Midjourney有一个明显的局限性在于,目前仅支持对MJ生成的图片进行扩展,不支持上传第三方图片,但是PS和SD都支持。
 
单纯从随便上传一张图就能很好地模拟风格并完成扩展这点,PS肯定是要更强大一些的,而且还有充分的自定义和修改功能
 
SD的优势则在于免费和开源,而且还在迭代,但目前的生成效果次于MJ和PS,操作难度也较高。
 
各位玩家可以按需选择!欢迎在评论区分享新功能使用心得哦


「头号AI玩家交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。
也欢迎围观小红书@头号AI玩家,我们在这里日常练习AI绘画,目标每日一更。
欢迎分享、点赞、在看
 一起研究AI

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存