专栏名称: 计算机视觉深度学习和自动驾驶
讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
目录
相关文章推荐
东方网  ·  上海5名公职人员被查 ·  2 天前  
警民直通车上海  ·  少年离家出走,看民警如何用三十分钟就找回.. ... ·  3 天前  
警民直通车上海  ·  少年离家出走,看民警如何用三十分钟就找回.. ... ·  3 天前  
51好读  ›  专栏  ›  计算机视觉深度学习和自动驾驶

终于!DALLE-3迎来重大更新!

计算机视觉深度学习和自动驾驶  · 公众号  ·  · 2024-04-27 01:28

正文

点击 蓝字 关注我们!

OpenAI发布了DALLE-3,它是一款全新的人工智能美术平台,目前正在进行初步的调研,十月,该软件将会通过 API在 Chat GPT Plus上发布。

关注 ai腾朗 ,即可免费体验无魔法的ChatGPT!




新版的发行有很多令人振奋的改善,比如用户界面操作更简便,图片制作更准确。



改变人机交互方式,AI作画更简单




DALLE-3最大的优点是,它使人类和人工智能之间的互动方式发生了变化。

用户只需要在 ChatGPT上写下自己想要看的东西,然后通过 ChatGPT为DALLE-3生成详细的提示。

研究成果将极大地降低 AI在美术创作中的应用难度,不但是DALLE-3技术的一次重大突破,更将对产生型人工智能美术的发展产生深远的影响。

OpenAI说,这样一来,越来越多的人可以使用人工智能来进行美术创作,因为他们不必精通于给出复杂的线索。

从操作性上讲,ALLE-3更多地将ChatGPT作为人类的辅助工具。

用户可以和 ChatGPT交流,大家一起集思广益,而 ChatGPT会把人的思想转换成DALLE-3可以听懂的暗示,让 AI更加精确地完成人的要求。

另外,DALLE-3还可以让使用者使用 ChatGPT修改他们的作品。用户可以让 AI做出和真人差不多的修改。


首席研究员兼DALL-E团队负责人Aditya Ramesh表示:“你可以和 ChatGPT进行交流,就好像你和你的同事谈话一样。”



让图文生成言出法随,细节绘制效果炸裂




除了文字本身的复杂之外,AI绘画者往往会发现自己的建模效果与自己所期望的不尽相同。

这主要是因为在文本到图片之间的转换时,存在着理解上的错误,从而导致了模型对关键信息的遗漏。

但 OpenAI将 Clip技术应用到Dalle 2中,通过对图像和文本的映射,实现了“言即所得”的突破。

这就意味当使用者提供线索时,他们所使用的每个详细资料,都会精确地反应在结果中。

这一创新极大地提高了模型对于文字与图像之间对应关系的理解能力,减少了误差的发生。



在 OpenAI的展示中,我们能清楚地看到,每个提示的详细信息都精确地体现在结果中。

但是,在实际的例子照片中,有些细节没有正确地恢复。举个例子,有一幅描绘了一艘沉没的宝船的照片,我们没有发现宝藏的踪迹。

DALLE-3不仅可以减少“提示工程”的复杂度,而且可以方便地进行人机交互,还可以精确地描述具体物体和它们之间的联系。

相对于DALLE-2,DALLE-3在文字、人物等细节上有了明显的改善。

在同样的提示词下,DALLE-3与DALLE-2的详细性能有显著不同。

下面这幅由DALLE-3绘制的图像,描述了一颗人的心,它是用一块透明的玻璃做的,它立于一个底座之上,太阳从云中穿过,照射到我们的内心深处,让我们看到了一个小小的世界。”


而且,“寻找你心中的世界”是用黑体蚀刻出来的。

我们能清楚地看见这幅画里的透明纹理和文字的表现。


如何直接使用ChatGPT?

1、点击下方名片关注“ ai腾朗 ”公众号



后台菜单栏点击






请到「今天看啥」查看全文