本文介绍了即梦3.0的发布以及其与GPT-4o、即梦2.1的对比。文章涵盖了即梦3.0的中文生成能力、审美和画质方面的进步,以及对于不同场景(如艺术字、产品海报、电商海报、活动海报、剧情漫画)的应用展示。同时,文章也提到了其他AI模型的优缺点,以及创作者在AI时代如何结合自身专业知识利用AI工具进行创作。
即梦3.0在中文生成方面表现出色,能够稳定地生成准确的文字和排版。相较于GPT-4o,即梦3.0在推理剧情的小漫画方面略有不足,但在其他领域已经展现出强大的实力。此外,即梦3.0还提供了多样化的艺术字设计,以及清晰的产品海报、电商海报和活动海报等。
相较于即梦2.1,即梦3.0在画质和审美方面有了显著的升级。2k画质的引入使得画面质感大幅提升,细节和颜色处理更加精致。同时,即梦3.0在时尚摄影和本地化审美方面也表现出色,能够呈现出高级感和杂志级别的图片。
市场上存在多个AI生成影像的工具,创作者可以根据自己的需求选择合适的工具来提升自己的工作效率。虽然AI技术发展迅速,但专业知识和技能仍然是非常重要的。设计师们可以通过结合专业知识和AI工具,实现超级增效。
即梦3.0 来了!
前几天我们还在为了 GPT-4o 强大的生成中文能力狂欢,现在,即梦3.0 又又又顶破了中文生成的天花板!
你们这 AI 生图的天花板是怎么了?疯狂卷出新高度是吧。
虽然但是,我们还是玩到停不下来!先放几张我觉得特别牛的例子:
这个中文能力稳定到基本上一两次就能抽出想要的准确文字和排版,而且对比之前的即梦2.1,画质和审美也有了非常显著的提升。
所以我和阿汤一拍即合,直接给大家上个大强度:
-
对比 即梦3.0、GPT-4o、即梦2.1 的中文生成能力
-
前方超多图预警!Here we go!
(以下部分案例由 @卡兹克、@歸藏 提供,感谢大佬们!案例太多,完整原图和提示语打包了,点击「阅读原文」即可)
Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过审核后工作人员会拉你入群~
01
多样化艺术字
先说结论,测试到目前为止,有很明显的感觉是即梦 3.0的中文能力整体上超过GPT-4o。但是在有推理剧情的小漫画上,GPT-4o有本身的语言模型的优势,整个的逻辑能力是更强的。下面,我们分成
艺术字
、
产品海报
、
电商海报
、
活动海报
、
剧情漫画
进行详细的对比。
首先最大的感受是,即梦3.0对于字体的设计非常多样,而且设计出来的字体特效感很强。这一点是目前 GPT-4o 只通过文字提示语做不到的,绝大多数情况还是需要把我们想要的字体样式图片发送给 4o 辅助它生成:
把 2.1、3.0 和 4o 这样放在一起对比就很明显了,即梦3.0 做的每一张细节都很足,对于“冰块”“糖果的胶状感”“雕刻金属感”,3.0都做到了极致。
实际上,当中文能够比较稳定的被 AI 生成后,有很多人都在说可以用来做自家产品海报。但放在从前,即梦2.1的图片还没有那么清晰,中文还总是带着一些乱码小字,导致不能够投入真正的生产中,但很明显这层壁现在被3.0打破了:
我不得不说,3.0洗衣液这个图真的有唬到我,从文字到产品再到一些周围的元素展示,整体上都很接近真实的产品宣传图了。虽然最终是否能够投入到实际的产出中还要另说,因为毕竟设计到商业产品,需要产品细节展示的非常精准,但作为一个排版灵感提示和初期 demo 是完全可以的程度。
电商这个品类,即梦2.1的时候就已经有雏形了。因为我们浓厚的电商大环境,所以训练素材非常丰厚。3.0做出来的很多图,我真的是觉得可以拿出来直接用的程度。
直接上三组大促图:
就3.0这个整体质感,不仅能够稳定输出大标题文字,而且周围元素搭配的都很准确,一些小 logo 比如那些礼品盒购物车啊啥的做的都很准确,不再是之前2.1经常会有模糊或者融成色块的感觉。说实话,我觉得一些小成本商铺之后直接拿来大促用都完全够用,这真的大大降本。
这个类型是我觉得进步最最最最最最大的一 part !直接是从不太能用实现了到接近真实生产效果的一大步跨越!大家直接看图就能明白我的意思了:
即梦3.0这几张图给我惊麻了!这几张进步太明显了,我感觉我在生活中好像真的看到过这样的海报。尤其是义卖会拿张图,场景、细节都太真实了,真实到我感觉它小的时候抱过我。
上次我们盘 4o 的时候,就说过它做漫画很强,更别说这几天铺天盖地火爆的用4o出各风格小漫画的教程了。当时,我们还捞即梦2.1出来公开处刑了一下。但没想到这才过了几天,即梦3.0就直接迎头赶上了:
说实话,需要自己推理剧情或者给到非常长提示文本的四格漫画还是 4o 的逻辑性更强一点。单张漫画图片的效果即梦3.0的效果已经可以直接追平 4o 了。就是也期待3.0也能赶快支持多张图上传辅助固定风格。
除此之外,我们还把前几天即梦2.1的图片又拿给 3.0 重新跑了一遍:
实际上,体验到现在,我可以很明确的说,生成带有中文字的图片首选即梦3.0肯定没错;如果需要模型自行推理并生成,可以使用4o。
但是随着 4o 生图开始给免费用户开放生图后,紧张的生图资源和超慢的 roll 图速度,还有时不时的直接卡住生图,确实让人恼火的很。
02
画质与审美
在 4o 出来之前,即梦2.1基本上已经覆盖了我80%以上的生图需求。Midjourney 越来越不听话,V7 又不知道啥时候出来;FLUX 大多数都用来做漂亮小姐姐的写实照片;一些 lora 模型又不太适合大批量图片的产出。只有即梦2.1是综合能力最好的,但唯一的问题就是那个画质差了点,中文有时候会乱码,画面上有时候总是会出来点莫名的不太需要的元素。但这些在即梦3.0上,好像都不是问题了。
同样的我们也是分为
影视级质感
、
时尚摄影
、
本地化审美
,和大家一起来看看即梦3.0对比2.1都做出了哪些升级。
即梦3.0上线了2k画质,不仅整体上画面质感提升了一个 level,整体审美上也有非常大的提高,就能很明显的感觉到现在的图片更高级了。
我们也拿非常多的图片对比一下2.1和3.0的区别,让大家一次性看个够。
3.0的 2k 画质就是强,而且2.1的即梦其实画面细节丢失的还蛮多的,之前的图片的颜色总是会有一点点糙的感觉。但现在的3.0把图片颜色处理的更加细腻了,细节也更精准,图片上少了很多无意义的线条和色块,图片看起来更精致了。
这一块我想单独拎出来说,也是因为有这两张我很惊艳的图:
直接幻视杂志封面了有没有,高级感要溢出屏幕了。如果说之前的即梦2.1是个刚拿起相机的实习生,现在至少要进步到独立工作室的程度了。期待支持一个垫图换脸,我也想给自己也来一组杂志大片。
果然啊,咱们自己的东西就得是咱自己的国产大模型生成。先不说之前的2.1就本土味儿就已经做的很好了,这升级之后确定不是谁在街上扫街拍到的吗?而且一些中国元素的展示,包括像京剧戏服、庭院细节、甚至是整个宫殿的构图和宫人的风格,都更贴了。
到这里,我只能说即梦3.0给我带来的惊喜是一波又一波。感觉我自己的 AI 作图工作流又可以进一步优化了。每一次有这样的感受,我都非常开心,因为确实能够感知到我们在进步,创作者也在随之进步,这样未来流向市场的也将是越来越优质的东西。
但我也想说,我们完全可以根据自己的需求选择使用的工具,一个新工具的出现不代表着我们要抛弃另一个工具,组合搭配,才能实现超级增效。
03
写在最后
这才4月刚开了个头,
AI生成影像的天就翻了又翻。
GPT-4o、Gemini 火了;
新来的 Runway Gen4 图生视频拉了,多参生成是个期货,遥遥无期;
就在这个意料的意料之外,毫无征兆的等来了这个大惊喜:
即梦3.0。
即刻造梦,梦想成真,
在这一刻又一次具象化了。
2025 对于设计师来说可能是有点噩梦吧,
但我有不同的想法,有着专业知识的设计师们使用AI的时候能站在巨人的肩膀上,
没错,你的专业就是最强大的后盾,是别人无论如何都夺不走的东西。
就像当年从手工绘图进化到拿起第一块数位板的那个时刻,
那在如今更新技术来临的时候,
又何尝不能加入呢?
@ 作者 / 阿汤 & 卡尔
@ 动手学AI知识库 / learnprompt.pro
转载原创文章请添加微信:founderparker