Midjourney应该是最近最火的 AI Image generator 了。相信即便你不是互联网从业人员,最近几个月有几个词汇的曝光度之高也会让你有所耳闻,比如GPT-4,Chat-gpt还有本文的主角,Midjourney.
一言以概之, midjourney 是一款你通过文字描述,就可以绘制出图像的 AI 应用,他生成的图像质量之高,令人叹为观止。我截取几张 midjourney 官网的 Explore 页面中用户生成的图片供大家参考。
可以感受到,这已经不是普通插画师能够绘制出的风格和水准了。 由于 midjourney 使用起来还有有一些门槛,所以本文写给完全没有任何编程基础的用户,你可以把本文当做一本 midjourney 操作指南来使用。
midjourney 重度依赖 discord 来操作,这里可能很多人没有听过 discord 这一款应用,discord是前几年诞生的非常火的一种新型聊天工具(在国内如何登上discord不在本文讨论范围之内),所有 midjourney 的图片生成操作都是在 discord 中生成的。所以你需要先注册一个discord 账号。注册方法非常简单,进入http://www.discord.com/之后,点击 Login 根据指示完成步骤即可。如图。
我们注册了账号之后,你可以利用浏览器使用discord,或者下载他们的客户端。进入discord页面之后,你可能会被眼前眼花缭乱的界面搞得七荤八素,但是不要紧,我们只需要掌握最基础的使用方法就可以了,毕竟我们是使用 midjourney 而不是成为discord 聊天大师。
接下来就是正式申请midjourney账号的步骤了,首先我们进入midjourney,官网如下图所示。
点击右下角的Join the Beta,之后他会要求你登录Discord账号进行第三方账号登录,输入我们刚才注册好的discord账号。
登录discord账号之后,你就成功加入了 midjourney 在discord 上的server。你会看到如下图所示的界面。
请注意我用红色方框圈起来的部分,这是 discord 中最核心的概念channel, 即频道,为了方便大家理解,我们可以简单粗暴的理解为频道就是微信里的群聊。
大家注意到,频道列表中,有一些频道是以newbies-打头的,这类频道就是所谓的新人体验频道,新人体验频道就是midjourney为了让我们上手体验 ai 做图创建的频道,我们选择任意一个进入。
进入后界面如下所示。
注意我红框标注的区域,这是我们需要打交道的人,即midjourney bot,机器人,方便理解,你可以理解为这是midjourney为我们提供的机器人客服。
在newbiew 频道的下方,我们可以看到输入框,接下来我们生成第一组图片,为什么称之为组,是因为每次你输入的描述图片文字会被midjourney生成四张一组的图片。ok,我们在输入框中输入/imagine, 当然你不用输完整的他就会自动弹出提示
这里出现了第一个关键词语prompt. 现在很多 ai 从业人士戏称为咒语,其实 prompt 就是我们描述图片的文字。比如,第一组图片,我希望生成一组站在草坪上的小狗,这句话翻译成英文是puppy standing on the lawn, 是的,目前 midjourney 只能支持英文,英文不好的朋友也不用担心,目前很多翻译软件都能帮你。 输入之后按下回车。 此时 midjourney 就会处理你的图片生成请求了。如果你是第一次使用,那么可能会看到如下界面。
点击 Accept 即可。
此时 midjourney 会把您的请求加入工作队列,因为同时请求做图的人很多,所以你的图不出意外的话会在1分钟左右做出来。 刚才的prompt 生成的图如下。
如上图所示,这一组图片下面出现了类似u1,v1的东西,这里解释一下这几个按钮的意思。 u = upscale, 后面的数字代表第几张图。那么u1的意思翻译一下就是,我觉得第一张图还不错,那么给我生成大图吧。 v = refine, 后面的数字同样代表第几张图, 那么v1的意思就是,我感觉第一张图还不错,你就按照第一张图的样子再给我生成4张差不多的吧. 第一行最右侧一看就知道是刷新按钮的按钮,点击之后会根据刚才的prompt重新生成一组图片。 当我们点击 u1 之后,midjourney 就会把第一张图做成一张高分辨率的图,结果如下。
当我们点击v1 之后, midjourney会根据第一张图的样式,生成一组类似风格的图片。
在频道里做图你非常显而易见的会碰到第一个问题,就是newbiew频道中做图的人实在太多,所以你发出的指令也好,midjourney 给你做的图也好,非常容易淹没在信息流中,找起来非常麻烦。所以我们有个很好的解决途径,直接将 midjourney bot 请到我们自己的 server 中。 做法如下
创建自己的server
选择 Create my own
输入server名称
点击刚才你创建的server, 点击server中的任意频道,你会发现
接下来你可以在自己的频道和bot做图了
俗话说,最好的学习是模仿,一开始直接琢磨学习 prompt 的用法是枯燥且低效的,最好的方法应该是先看看优秀的图源,他们的prompt到底是怎么构成的。我们有个很好的地方可以学习,就是 midjourney 的 explore 页面。midjourney feed进入页面后,我们可以任意点击一张图,进入。
这张好看的图片下方我们可以清晰的看到,生成这张图片的 prompt。 我们可以直接复制 prompt.
这里我简单列举一些常见用法。
--ar 9:16, 我们常常能在prompt 中看到这样一句话, 以--ar开头,后面接一组数字,这个命令的意思是告诉midjourney 我希望生成图片的宽高比, 也即aspect ratio.
--v 5, 这个命令的意思是告诉 midjourney 我希望用哪个版本的midjourney 生成图片,目前midjourney 最新到 5.
::该符号使用两个冒号做分割,这个官网解释的很好了,这个符号主要用来分割词组。例如,我们使用hot dog与hot:: dog做出的就是两张完全不同的图,第一张图,由于两个单词之间没有::,所以midjourney 会认为这句话两个单词组成的,意思就是热狗,那么第二个prompt由于单词中间有::,midjourney会认为这是两个词语,两个意思,表达的是一条很热的狗。所以生成的就是一个狗狗他很热。
hot dog
hot:: dog
4.,, 逗号,逗号官方称之为soft break, 上面的双冒号称之为 hard break, 意思就是,用逗号分割 prompt 中的词组往往对整个 prompt 的意思不构成影响,但是双冒号是硬分割,使用双冒号分割 prompt 中的词组往往会形成两个绝对独立的意思,所以使用逗号不会对整个prompt 的整体意思构成较大影响。
5.light::8, 这种形式为单词+::+数字, 这个形式的意思是,某个单词在整个 prompt 中的权重,权重你可以理解为,如果我希望某张图中,该单词的对图片的影响变大,那么我可以用这种形式控制某个词组对图片的影响力。
除此之外,midjourney 还有很多有用的命令,比如 blend, stylish, chaos 等等,他们都会对图片的风格有相当明显的影响,当然,实践和模仿依旧是最好的学习方法,多去自己操作,才能体验ai带给大家的快乐和便捷吧。