玩了两天 Midjourney 了,今天花时间好好看了一下官方文档,把一些我比较感兴趣的点摘录一下。
咒语的正确读音
你可能已经知道 AI 画图只需一道咒语,这个咒语的专业名称叫 Prompt。
首先是 Prompt 的读音,我这 Poor 英文一直都把它读作“普肉木普特”,其实人家那个 M 不发音,应该读作:
基本画图方法
Midjourney 的 Prompt 由三部分组成:图片链接、文字描述和若干参数,官网的这张图一目了然。
基本的画图功能只要写文字描述就可以了,在官方的 Discord 频道的机器人对话框中输入命令:/imagine,随后会自动呼出画图模式,后面的参数 Midjourney 会自动添加一个模型的版本号,比如 --v 5:
稍等片刻就画出了这样一张图:
现在画出了 4 张图,从 1 开始依次编号。
在图的下面会有一些按钮:
U 开头的按钮表示要把对应编号的图片放大,单独给出来。
V 开头的按钮表示以对应编号的图片的样式和构图为模板,再生成四张图。
剩下的按钮是刷新按钮,表示以当前的 Prompt 重画一遍。
当然如果想自己指定版本号也是可以的,比如在文本后面指定 5.2 版本,--v 5.2:
只不过我觉得画出的结果相差不是很大,都还不错。
Prompt 应该尽量精准简短,不要一堆废话。比如这个就不太好:
Show me a picture of lots of blooming California poppies, make them bright, vibrant orange, and draw them in an illustrated style with colored pencils
Midjourney 官网示例
应该替换成:
Bright orange California poppies drawn with colored pencils
Midjourney 官网示例
上面的反例画出的图是这样,可以看到它没有画出彩色铅笔(colored pencils),语义表述不到位。
以图生图
在文本前面加上图片链接就可以以图生图了。
那么图片的链接从哪里来呢?可以用公网上搜到的图片,但是如果你懒得找,也可以输入 /describe ,上传一张自己的图片,然后 Midjourney 会描述一下这张图片的内容。当你的图片上传后,长按这张图片,选择复制链接,就得到这张图的链接了。
我随便画了一张比较抽象的小猪跳舞的图片,然后被 Midjourney 判定为违规,理由是这只小猪没穿衣服。
于是我又画了一张穿了衣服的版本。
Midjourney 给出的描述是这样:
下面我用这张图来配合一段 Prompt,让它帮我生成一张全新的图片:
/imagine 图片链接 A cute little piglet standing, wear short sleeves and sports shorts printed with the word "PIG", illustration,Exquisite details, ultra high definition, 8k
怎么样?是不是还不错。我觉得第二张图最接近我的原图,我点了一下 V2,让它帮我再来 4 张相同风格的图。
画图效果我已经很满意了,只是衣服上的“PIG”字样显示的不是很完美,可能要达到这一点需要特殊的技巧。
调整图片的风格
除了要花心思描述图片的内容之外,如果指明了画作的风格,出来的图效果差距会很明显。比如:
Block Print 风格的奥黛丽赫本:
Block Print Audrey Hepburn --v 5
Risograph 风格的玛丽莲梦露
Risograph style Marilyn Monroe --v 5
Ukiyo-e 风格的钢铁侠
Ukiyo-e style Iron Man --v 5
官网提供的风格有这几种:
Block Print
Folk Art
Cyanotype
Graffiti
Paint-by-Numbers
Risograph
Ukiyo-e
Pencil Sketch
Watercolor
Pixel Art
Blacklight Painting
Cross Stitch
只要按这样的格式写 Prompt 就行:XX style XX,默认的效果已经足够惊艳。
调整线条的风格
还可以指定线条的风格:
斯嘉丽约翰逊的素描画
Continuous Line sketch of Scarlett Johansson --v 5
Blind Contour 素描线条风格的漩涡鸣人
Blind Contour sketch of Naruto --v 5
护额上的木叶村标志很标准呢。
官网给出的线条风格有这些:
Life Drawing
Continuous
Loose Gestural
Blind Contour
Value Study
Charcoal Sketch
指定图片内容的年代
还可以指定图片内容所处的年代:
1700 年代的外星人
1700s alien illustration --v 5
有点惊悚。
1920年代的神奇女侠
1920s Wonder Woman portrait --v 5
1920年代的盖尔加朵
1920s Gal Gadot illustration --v 5
年代的选择就写整数年代就行。
另外还可以指定情感,色调以及图片主体所处的环境等等。
图片混合
还有一个我很喜欢的功能,Midjourney 的 /blend 命令可以把两张图片混合起来生成一张新图。比如我把一张老虎和一张老鹰的画组合在一起,就得到了一头没见过的怪兽。
虽然挺帅,但是它好像不会飞的样子。
生成小视频
如果在 Prompt 末尾加上 --video,还可以生成一个表现绘图过程的小视频。绘图完毕之后,将鼠标移到消息的区域,点击右上角的第一个添加反应的按钮,然后在呼出的对话框里输入:envelope:,选择第一个信封的图标,就可以生成视频了。
Princess Elsa of Frozen blinked --video --v 5.2
背景音乐是我后来加的,默认生成的视频是无声的,还不错吧。
以上就是一些基本的上手玩法。后面还有更多高级的专业玩法,比如各种参数的选择,包括图片的宽高比,图像的摄影类型等等,官网都罗列的非常详细,我后续一一尝试过后再写。
你如果感兴趣,也可以赶快玩起来呀!
题图:《浮世绘风格的艾莎公主》
模型:Midjourney v5.2
Prompt: Ukiyo-e style, Princess Elsa of Frozen blinked --ar 16:9 --v 5.2