主要观点总结
文章介绍了AI绘图产品Ideogram更新了其2.0版本,该产品在文字嵌入和图片美学质量上表现出色。文章分析了Ideogram相较于其他AI绘图产品的特点和优势,并详细描述了其语义理解、文字生成能力、写实、设计和3D等方面的表现。此外,文章还提到了Ideogram的价格以及Midjourney的应对措施。
关键观点总结
关键观点1: Ideogram更新了其2.0版本,具有强大的文字嵌入能力和高质量的图片美学。
文章介绍了Ideogram的新版本更新,强调了其文字嵌入和图片美学的卓越表现。
关键观点2: Ideogram相较于其他AI绘图产品具有优势。
文章通过对比分析,突出了Ideogram在语义理解、文字生成能力、写实、设计和3D等方面的优势。
关键观点3: Ideogram提供了风格选择器,包括写实、设计、3D、动漫等类别。
文章介绍了Ideogram提供的风格选择器功能,并强调了其在不同类别中的表现。
关键观点4: Ideogram的价格合理。
文章提到Ideogram的价格不贵,对于用户来说是一个不错的选择。
关键观点5: Midjourney的应对措施。
文章提到了Ideogram发布2.0模型后,Midjourney的应对措施,包括网页版开放和免费试用回归。
正文
大
半夜的,可能是我认为做海报、做 logo、做文字最猛的 AI 绘图产品,
Ideogram
,更新了他们的 2.0 版本。
把文字嵌入和整个图片的美学质量,又一次推上了巅峰。
不过并不妨碍它一直是我心中,做文字生成最厉害的产品。
在我们做 AI 绘图的时候,其实过往一直都有一个痛点是,在图片里面嵌入文字,效果都很差。
比如说,我想生成一张图,大概是一个女生面对着镜子,镜子上面贴着一些纸,上面写着一些鼓励的话语。
A captivating vintage-inspired photograph with distressed edges, featuring a strikingly beautiful, young woman gazing into an ovalmirror. The mirror is adorned with four sticky notes displaying positive affirmations in bold text, such as 'I AM AWESOME', 'I AM LOVEABLE', 'I DESERVE RESPECT', and 'I CAN DO HARD THINGS'. Fairy lights encircle the mirror, casting a warm glow over the scene. A wooden sign at the bottom of the image reads, "Talk to yourself like someone you love." The woman sports a messy bun hairstyle adorned with flowers, and wears a verdant dress. The room exudes a cozy ambiance, and the overall mood of the image is uplifting and empowering., typography, photo
(一张充满复古风情的照片,边缘略显磨损,画面中一位美丽的年轻女子凝视着一个椭圆形的镜子。镜子上贴有四张写着积极肯定语的便签,字体醒目,如「我很棒」、「我值得被爱」、「我值得尊重」和「我能应对挑战」。镜子周围环绕着仙女灯,柔和的光线笼罩着整个场景。照片下方有一个木制的标牌,上面写着「像爱自己一样与自己对话」。女子梳着随意的盘发,发髻上点缀着花朵,身穿一袭翠绿色的连衣裙。房间氛围温馨舒适,整张照片传递出积极向上、充满力量的情感。)
这么多还分区域的字,基本没有任何一个 AI,能把这些字完整的、不出错的写到图中,还能保证美感和融合。
Midjourney 直接废了,纸上的字都是错的,镜子里面人都没了宛如鬼片,下面的木质标牌也没了。
而以语义理解闻名天下的 Dalle3,美感极度拉跨,字也写错了,但是大的东西没丢。
文字写的非常无敌,全都分区域分块给你写的明明白白,美感也很强,唯一不足的就是镜面的物理规律反了。
从这个 case,应该就能看出,Ideogram 的特点在哪了吧。
极强的文字嵌入能力,还有目前超一线的图片质量,这两个合在一起,就足够让人兴奋了。
过去很多人问我,有没有一些 AI 生成海报 AI 生成 logo 的产品,我只能说,没有。
因为这两个设计类别,都是以信息为主,而信息的核心载体,是文字,只有解决了文字的准确性,同时审美足够在线,你才能说这玩意,可以生成海报生成 logo。
这次的 2.0 更新,重点更新了模型的质量,还有继续究极进化的语义理解能力,我觉得已经是吊打 Dalle3 的级别了。下面
给大家看看模型的效果。
点击关注,每天更新深度 AI 行业洞察
01
语义理解
超过 Dalle3,
文字生成能力遥遥领先
写实、设计、3D、动漫,这四个类别的质量得到了大幅强化。
而 Ideogram 也贴心的为你设计了风格选择器。
直接选择就行,这几个分类还是我比较喜欢的,因为甩几十个类别出来也没有意义,这四个,足够了。
在写实层面,跟 Flux pro 和 Midjourney 比,我觉得也不遑多让。
整体差不太多,质感是 OK 的,上限能跟 Midjourney 打平,但是 roll 起来的成功率会低一点。
给我的一个很大的感觉就是,线条非常干净,以及这个语义理解实在是太强了,什么稀奇古怪的东西都能揉在一起。
Ideogram 整体的模型质量,如果让我评价的话,综合质量在 Flux pro 之上,Midjourney 之下,但同时有两块超长的长板,就是超过 Dalle3 的语义理解能力,以及领先一个世代的文字生成能力。
因为这两个长板,在实用性上,我觉得甚至可以跟 Midjourney 平起平坐了。
而且他们还有一个很有趣很棒的功能,就是 Magic Prompt,跟莱昂纳多的那个 Prompt 优化是一样的,但是 Ideogram,可以写中文,然后他帮你,自动翻译成英文。
比如我就写了简单的几句中文:「摄影棚中的时尚美女,kpop,极度真实」
当然,得益于他们的超强的文字嵌入功能,用它来做 Banner 来做海报,也终于,成为了现实。
把文字能完整的嵌入图片中,替代一大部分的信息设计,我觉得这个才会能进入设计师的工作流,从而产生巨大的潜力。
02
AI 绘图大战的鲶鱼,
Midjourney紧急免费
Ideogram,绝对是当前,AI 绘图大战的一条鲶鱼,他解决了过往关于设计、关于文字、关于实用的巨大痛点,异军突起,发光发亮。