在差不多一年前,刚刚接触 Midjourney v4 版本的我大受震撼,想要把「AI 绘图」当做一个年度课题来研究,探索下 AI 绘图到达了什么阶段,我们普通人可以用 AI 绘图做点什么。于是我发布了一个在「小报童」上的付费专栏:
一些 Midjourney 的入门指南与绘画经验
此后,我就不断在尝试各种 AI 绘图的边界,看到底能画出什么、不能画出什么。有几篇公众号文章是关于习作分享的:
Midjourney 绘图习作
1
Midjourney 绘图习作
2
有一次尝试画出有故事有剧情的漫画:
打鱼记·上(Midjourney 漫画)
还有探讨 AI 绘图版权问题的:
AI 作图的版权属于作者吗?
当然,最多的实际探索中学习的内容,都放在了我的付费专栏「Midjourney进阶创意库|2023」中。本着跟大家共同学习进步的态度,专栏的定价几乎是按照一篇内容一块钱的价格来的,用少楠的话说,这实则是一个短期研究项目,并不是有利可图的商业项目。价格门槛是筛选的过程。
那么在一年之后,我得到了什么结论呢?有这么几点。
第一,Midjourney 乃至 AI 绘图的进展是神速的。
这是我用 Midjourney 绘制的第一幅图,此时还是粗糙版本的 v3:
我尝试用同样的 prompt ,在 v5 的版本下重新绘制,会变成这样:
如果添加一些新的风格设定,可以是这样:
甚至可以是这样:
我做了一个对比图,可以直观看到这一年多 Midjourney 从「不能用」变成「可用」,再变成「接近易用」的变化。顺便也祝各位圣诞快乐:
这种神速,让我们很难猜测 2024 年,乃至 2030 年,AI 绘图会进化到什么地步。
而像画手指、识别字符这样的细节技术难题,并不会很难解决。让一些朋友失业是必然的。
第二,AI 绘图的易用性的进步也是神速的。
这一年两次重要的转折点,大大推进了易用性:
第一个转折点是大概在 4 月份,
Midjour
ney 的
describe 指令的出现。
Describe 可以直接识别图片,让面对空空的对话框压根没办法冷启动的用户,有了一个简单的、低门槛的使用方法。
用 describe,我们可以做出大量漂亮的图片。这些都是在我的专栏里出现过的。
这次之后,我们反复去学习 prompt 的词库,不如从 describe 的结果里做微调,效果会更好。
第二个转折点,
是 GPTs 中有了 DALL·E
。这是刚刚才出现的。
Midjourney 的绘图模型自然是地球第一,但是 ChatGPT 有语言理解上的加持,体验就完全不一样,很多理解上有非常大的优势。之前有一篇专栏文章单独提到了,这里就不展开了。
这两个转折点说明,AI 绘图的难点是在人机交互上,但人机交互并不是很难解决的问题。
对于 AI 绘图来说,在年初出现了大量的词库和教背关键词的教程,实际上,记忆一些关键词意义真的不大。之前本来就意义不大,现在可以说更是完全没有意义了。
第三,
不断
实践,不断体会
。
只有不断练习,不断去画,才能真正理解 AI 绘图。真正用 AI 绘图改善生产力,才是唯一有意义的。
哪怕不是很大的,哪怕就只是在小红书上卖壁纸,卖 1 块钱也是胜利。
说几个场景可以感受一下:
-
-
-
一个手机的主题商店开启了壁纸比赛活动,一等奖有 10000 的奖金
-
-
这些才是真正能实践、落地的场景,才是真正能学到东西的地方。
也因此,我目前能够实践的地方,正在尽可能用 AI 完成。我的每一期《三五环》《半拿铁》播客的封面、“刘言飞语”公众号的头图,都是 AI 绘制的,会收到一些好评;我在写的新书,也正在用 AI 做基础的设计。去参加的一些活动的素材和海报,也在尽可能都用 AI 做的图。这些才能让我持续感知到 AI 的边界在哪里、能真正用在什么地方。
各位也可以去看看《半拿铁》的播客封面的变化,也会感知到我在用 AI 画封面的主题表达、整体呈现上,也是在步步精进的。
而我所有这一年的实践经历,画出的 1500+ 的图,都浓缩在我的付费专栏里了。确实这些比较用心,就属于付费才能观看的了。