专栏名称: 硅星GenAI
比一部分人更先进入GenAI。
目录
相关文章推荐
湖北生态环境  ·  交易额增长超九成!“China ... ·  21 小时前  
湖北生态环境  ·  交易额增长超九成!“China ... ·  21 小时前  
广西广播电视局  ·  自治区广电局圆满完成2025年春节广播电视安 ... ·  昨天  
广西广播电视局  ·  自治区广电局圆满完成2025年春节广播电视安 ... ·  昨天  
李楠或kkk  ·  其实,既然说 ai ... ·  2 天前  
调研纪要  ·  中国拟调查“苹果税” ·  2 天前  
调研纪要  ·  中国拟调查“苹果税” ·  2 天前  
51好读  ›  专栏  ›  硅星GenAI

用了 ChatGPT 最新语音功能之后,真的越来越像《Her》了

硅星GenAI  · 公众号  · 科技自媒体  · 2024-09-27 17:10

主要观点总结

本文介绍了GPT-4o的语音交互能力,包括其高级语音模式的特点和实用功能,如逼真的情绪表现力、支持中文方言、为盲人描述画面等。文章还提到了AI技术的不断迭代和广泛的应用前景。

关键观点总结

关键观点1: GPT-4o的语音交互能力令人震惊,具有高级语音模式,表现出强大的情感表现力。

GPT-4o的全量推出,展示了其在语音交互方面的技术实力。其情感表现力丰富,能够根据用户的语速、语气和词汇做出相应的调整,使对话更加自然和贴合情感氛围。

关键观点2: GPT-4o支持多种语言和中文方言,为用户带来地道的语言体验。

GPT-4o的语音功能支持50多种语言,包括中文方言,如北京话和粤语等。虽然方言的语音数据相对有限,但GPT-4o已经能够表现出一定的方言能力,让人感受到其技术的进步。

关键观点3: GPT-4o的高级语音模式具有实用功能,如为盲人描述画面等。

GPT-4o的高级语音模式不仅具有娱乐性质,还具有实用功能,如为盲人用户描述画面等。其描述方式有感情,能够照顾到盲人的感受,展现出AI技术在多个场景中的广泛应用前景。

关键观点4: AI技术的不断迭代使得GPT-4o的语音交互越来越像人类。

随着AI技术的不断迭代,GPT-4o的语音交互能力越来越强大,让人惊叹。未来,我们与AI的对话可能会涉及情感、文化和个性等方面的互动,展现出科技在让AI越来越‘懂人’的同时,也让我们逐渐‘懂得’AI的世界。


正文

在 GPT-4o 的发布会上,最令人震惊的就是它的语音交互能力,像人一样对话的节奏感、超逼真的语气,在期货了 4 个月之后终于来了。这项功能会在一周内全量推出,多亏社群里近日点科技的阿茶老师提供账号,让我们能第一时间能上手玩到。
使用后第一感受就是:
  • 未来感 :感觉就是《Her》电影里的场景被直接搬到了我面前!
  • 人味儿 :这语音可真够“贴心”,完全不再像机械冷冰冰的回答了。
  • 速度 :不用再盯着转圈圈看天花板了,几句话就能拉起一场对话。
  • 仍然是个不完全体,跟当时发布会演示的功能还有差距。

#01

演技一流:情绪说来就来

人生如戏,全靠演技。 连 AI 都能有这么逼真的情绪了,演员们看看!

在高级语音模式下,ChatGPT 的情感表现力有了大幅提升。 以前,AI 和你对话的情绪可能只是表面上的,现在则 能根据你的语速、语气和词汇做出相应的调整。 这意味着,不仅仅是语音听起来更自然,AI 的反应也更加贴合对话的情感氛围。

绕口令:烫嘴2倍速
话说昨天,你就回本了吗?
事情是这样的,长期跌跌不涨的A股,9月25日直接冲到3000点,涨停了!直接给上交所宕机了!
网友称:事情来的太突然,好平啊,突然这么稳,有点不适应了,我的过山车呢?
更有网友谈到:畸形市场,周一都要火化了,周四KTV,直接太兴奋脑梗。
有一说一,踏空确实比亏钱难受。现在让 ChatGPT 给大家一些鼓励,表演《华尔街之狼》小李子在办公室演讲激励人心的经典桥段。

ChatGPT 不仅能配合情绪,还能调整语调和节奏,仿佛真的在演一场戏。 语音模式的情绪感知能力让对话有了更多的层次感,感觉像是真在演戏,甚至有点小“飙戏”的意味。
OpenAI 还给这个模式加了个自定义指令的功能,你可以指定它用什么方式回应,让它成为你的“私人定制语音助手”,不管是严肃的讲解还是搞笑的调侃,随你心情变换。

#02

中文方言不在话下:地地道道的北京味儿

现在,ChatGPT 现在支持 50 多种语言的语音功能,甚至中文方言都可以。
先来点儿北京话,“您甭说,今儿真成,走到这儿,我这叫一个舒坦!”要是 ChatGPT 能把 这京腔儿“卷舌儿”味儿 带出来,那就算它是真有进步了。
别说,ChatGPT 这方言讲的真不赖,北京腔“儿”十足。除了北京话,还聊到了粤语,有没有广东的朋友?来点评下 ChatGPT 的粤语正不正宗?
长时间对话会发现,ChatGPT 的方言逐渐“淡化”。它能用各种方言开个头,但聊着聊着就不自觉切换回了普通话。这其实是因为方言的语音数据相对有限,需要进一步打磨,才能真正做到畅快的方言唠嗑,期待它的升级。

#03

说唱:只会说不会唱!

千等万等,终于等来了,看着一个月之前小部分网友的测试效果,既能 Box,又能唱歌的,好不羡慕。
但我发现高级语音模式下的 ChatGPT, 只会说不会唱。
如果你聊到“模仿、唱歌、学谁说话”等内容,基本都会被它拒绝,这是因为 OpenAI 设置了相关的版权保护措施,禁止 AI 模仿特定的声音或生成音乐内容。

OpenAI 禁止 AI 模仿特定的声音或生成音乐内容

给了它几个关键词,让他来段 Freestyle,但它依然不会唱,而且写出来的不像说唱歌词,更像是诗朗诵。
关键词:A股涨停、OpenAI高层出走、牛马、摆摊、云养猫
视频和歌词一起食用,效果更佳哦!







请到「今天看啥」查看全文