专栏名称: Dots机构投资者社区
机构投资者组成的社区,深度点评财经事件
目录
相关文章推荐
51好读  ›  专栏  ›  Dots机构投资者社区

ChatGPT「睁眼」了!OpenAI版「Her」满血上线,还有圣诞限定彩蛋

Dots机构投资者社区  · 公众号  ·  · 2024-12-14 08:15

正文

本文转自微信公众号“新智元”,作者:新智元。




编辑:编辑部 HYZh
【导读】 时隔7个月,OpenAI版「Her」终于全量上线了!视频聊天和屏幕共享两大功能畅玩,还送上了圣诞老人限定声音。

OpenAI直播第六天,可以说是把圣诞氛围拉满了。

在高级语音模式中,不仅加入了视频聊天,而且还有限定版圣诞老人语音。
这就意味着,通过设备共享摄像头摄取到的内容,我们就可以和「Her」实时视频对话了!

与此同时,Day 6还给到了另一个大更新——实时屏幕共享。

对OpenAI的高级语音模式来说,和视觉AI功能的合并,让它可以处理视频或屏幕上的内容。

注意,页面中已经出现了视频按钮

对此,网友们表示:视频一下子就增添了很多诚意和人性。

还有人说,非常希望自己失明的祖母用上这个功能。

不过,怎么听着有点耳熟?昨天经过谷歌Gemini 2.0发布洗礼的读者可能会发现,这些,好像都是谷歌玩剩下的……

视频通话自我介绍,记忆大考验


几天前,总裁Greg在《60分钟》访谈中,再次预告了ChatGPT视频理解的强大能力。

它不仅可以通过实时视频看到世界,还可以进行实时语音互动。

它流畅地主持了一场解剖学测验,能够实时审阅黑板上的手绘答案并提供反馈;还写了一首三角形面积公式的押韵歌,并用英式口音唱了出来

今天,这一功能真的全量上线了。

OpenAI产品负责人Kevin打开视频通话,介绍了今天出场的四位成员。

ChatGPT非常丝滑地和他们一一打了招呼,而且每个回答都非常高情商,情绪价值满满。

比如「ChatGPT多模态团队的工程师?很有趣的工作」,「看起来你们在做一些很棒的项目」,「多模态研究听起来很迷人」。

左右滑动查看

接下来,Kevin决定测试一下ChatGPT, 看看 是否还记得刚刚见过的这几位研究员。

果然,无论提问戴着驯鹿角的是谁,还是戴着圣诞帽的是谁,它都能立刻给出正确答案。

时隔7个月,OpenAI正式推出了视频和屏幕共享的功能。有了这个功能,任何人都可以像是和同事朋友一样,在ChatGPT中通过高级语音进行对话。

高级语音模式,使用的是多模态4o模型。这意味着它可以直接输入音频,理解并直接输出音频。

相较于普通语音模式,与高级语音的对话具有更加自然的对话节奏,能够在超50种语言中传达丰富的情感和语调。

接下来的时间里,研究人员又让ChatGPT教学冲咖啡。

制作手冲咖啡,手把手视频教学


日常学习生活中,我们在搜集一项技能对应的教程时,常常苦恼只有晦涩难懂的文字,并没有谁能够在网络上对你进行手把手的教学。

而现在,你可以通过视频和语音实时与ChatGPT交流,比如请求帮助、排除故障,或者用它来学习新东西。

接下来,让我们看看它是如何手把手地教人制作手冲咖啡。

研究员给ChatGPT共享摄像头内容,并询问它:「你看到我面前有什么吗?」

它会回答:「是的,我看到在你面前有一套咖啡设备,其中有一个水壶和一个漏斗。你打算冲咖啡吗?」

可以看到,ChatGPT不仅迅速判别出场景的物体并给出回答,甚至在没有引导的情况下便主动地发现了场景潜在的需求,然后向研究员提出了对应的问题。

接着研究员表示自己打算制作手冲咖啡,并让ChatGPT给出引导步骤:「我打算手冲咖啡,你能告诉我该怎么做吗?」

「当然!首先,把滤纸放在滴滤器中,并用热水冲洗来去除纸味。这也可以给漏斗和杯子加温。」

「接下来,将研磨好的咖啡放入滤纸中。通常每2汤匙的咖啡需要大约6盎司的水。

「然后,你要轻轻地在咖啡粉上倒入少量热水,让它们闷泡(Bloom)约30秒。」

研究员对于ChatGPT回答中的词汇表示疑惑,让它进行相应的解释。

「好的,但闷泡是什么意思?」

「闷泡指的是激发出咖啡的香气,然后将热水打圈倒入滴滤中」

「你做的很棒,慢慢来,慢慢地倒热水更有助于均匀地浸泡出咖啡粉的风味」

在手冲咖啡即将制作完成时,研究员继续让ChatGPT对自己的表现进行点评。

「你的表现很棒,只需保持稳定地缓缓注水,你到目前为止都做的很出色。」

ChatGPT不仅仅只是能给出具体的实施步骤,同时也可以判别你的行动是否是正确的,并及时给出对应的反馈,甚至还能对你进行及时的赞美与鼓励。这种具有情绪价值的教学,比很多散不掉「爹味儿」的指教要好的多。







请到「今天看啥」查看全文