一、什么是提示词
提示词是AI绘图的核心和主体,是与AI对话的语言,只有精到、准确的提示词才能生成特定风格、满足既定需求的图片,也就是说提示词Prompt是AI绘画的魔法和咒语
关于提示词的定义,我们先来看看官方文档上的界定:
A Prompt is a short text phrase that the Midjourney Bot interprets to produce an image. The Midjourney Bot breaks down the words and phrases in a prompt into smaller pieces, called tokens, that can be compared to its training data and then used to generate an image. A well-crafted prompt can help make unique and exciting images.
中文翻译为:
提示词Prompt是这样一个简短的文本表述语句,Midjourney机器人将其转译来生成一个图像。Midjourney机器人将提示词中的单词和短语分解成更小的片段,称之为令牌,而这些令牌可以与Midjourney训练数据进行比较,然后用来生成图像。一个精心设计的提示词可以帮助你生成独特的和令人兴奋的图像。
从上面的定义可以看出,提示词是一种人机对话的自然语言,人类可以输入我们日常使用的语言来让Ai来处理,而不是以往程序员们使用的特定编程语言。
如果你看到我之前列举的AI绘画底层原理的资源,大概能明白,模型训练时AI会将自然语言提示词拆解为一个个token令牌,将文本转化为数字,将文本这种高维信息降维为数学可以处理的向量数据,从而将视觉信息转化数学运算,经过复杂的算法增加噪点以及逆向去噪最终释放维度还原为图片信息。
这也就一定程度上意味着,Midjourney绘画更擅长处理文本信息,而且并不包含逻辑推演和计算。我看到推特上有人在提示词中使用数学函数和公式,并由此生成了漂亮的图片。但我以为这只是随机性的副产品,Midjourney并不具备数学计算的能力,我们日常使用提示词时主要还是聚焦在文本语言的叙述上。
二、提示词结构
知道了提示词的含义,下面我们来拆解一下提示词的结构。
Discord输入框中,输入法在英文状态下输入反斜杠/,于是系统就唤起常用命令,我们选择imagine,此时鼠标就定位到提示词输入框,这一部分就是我们日常输入提示词的区域。
根据官方文档介绍,提示词基本结构分为三部分:图片提示(Image Prompts)、文本提示词(Text Prompt)、后缀参数(Parameters),且每一部分用空格分开。
在当然这三部分中,文本提示词是必不可少的部分,也是提示词的主体,图片提示词在需要提供参考图片(也即垫图)时使用,如果不需要可以略去,后缀参数可以使用系统默认的设置,也可以自己设定。一言以蔽之,提示词的核心是文本提示词(以及后缀参数),也是我们日常最需要花功夫的部分。
我们以文本提示词一只猫(a cat)为例,提示词的三种情形:
提示词主要是对生成对象的文本描述,要想比较精到地反映对象需要全面、精炼、简洁地用词,大体上描述一个对象或者一个图片,文本提示词可以从主体描述、环境氛围、艺术类别、艺术风格、材质、构图、视角、光照、色调等等方面来解构,这个后续会进一步阐释。
三、提示词与Midjourney绘图的基本操作
在Discord输入框输入上述提示词后,按Enter键系统就会开始绘图,并一次性返回一组四宫格图片(每张512 x 512像素)。这组四宫格图片有默认的序号,从上到下从左到右依次为1、2、3、4
- U指对图片放大,比如U1指的是对第一张图片放大,放大后的图片有更高的像素质量。如果你对放大后的图片满意可以点击小红心给系统反馈,帮助训练算法;如果你不满意,也可以点击第一个“Make Variations”(产生变体)进入Remix模式,修改提示词并以该图为基准继续生成。
- V指的是Variations(变体),当我们对生成的四张图片中的某一张满意并想以此继续生成时可以使用V+数字序号,比如V1指的是以第一张图为基准继续产生图片。
基本上来说,Midjourney在输入提示词后第一回就生成满意的概率不高,我们往往需要不断地V图和U图才能找到满意的图片,我们常常开玩笑说AI绘画就像抽卡,指的也就是Midjourney出图随机,废片率高,可控性差,很难一次成图。
文章标题:Midjourney小白教程:提示词入门
更新时间:2024年02月23日
本站大部分内容均收集于网络!若内容若侵犯到您的权益,请发送邮件至:info@lanbo.ai我们将第一时间处理!
资源所需价格并非资源售卖价格,是收集、整理、编辑详情以及本站运营的适当补贴,并且本站不提供任何免费技术支持。
所有资源仅限于参考和学习,版权归原作者所有,更多请阅读AIGC研究院网络服务协议。