专栏名称: 机器学习研究组订阅
连接人工智能技术人才和产业人才的交流平台
目录
相关文章推荐
爱可可-爱生活  ·  【Xyne:AI驱动的开源工作搜索与问答引擎 ... ·  14 小时前  
爱可可-爱生活  ·  【[655星]obs-localvocal: ... ·  昨天  
云头版  ·  全球排名第1企业引入DeepSeek! ·  2 天前  
云头版  ·  全球排名第1企业引入DeepSeek! ·  2 天前  
宝玉xp  ·  OpenAI 发的视频:What do ... ·  2 天前  
爱可可-爱生活  ·  【[966星]Typr:Neovim上最漂亮 ... ·  3 天前  
51好读  ›  专栏  ›  机器学习研究组订阅

终于来了!OpenAI开放GPT-4o高级语音,还用中文说「对不起」

机器学习研究组订阅  · 公众号  · AI  · 2024-09-25 18:24

正文

这项高级语音功能,大家可是等了好久。


谷歌又被 OpenAI 截胡了。


前脚谷歌刚刚升级完两款模型 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002,后脚奥特曼就直接宣布 GPT-4o 今天起正式开放。


「高级语音功能今天推出!(将在本周内完成),希望您的等待值得。」奥特曼表示道,最后还不忘加一个委屈、小桃心的表情。



这次,OpenAI 的高级语音功能将向所有的 Plus 和 Team 用户推出。但免费用户是体验不了了,因为 OpenAI 暂时没有这个计划。


据了解,Plus 用户每月需支付 20 美元,Team 用户每月支付 30 美元并拥有更多的使用次数。OpenAI 将逐步向用户推出访问权限,并从下周开始面向企业和教育推出。所有 Plus 用户将在秋末之前获得访问权限。


如果你是 Plus 或 Team 用户,当访问高级语音功能时,会在应用程序中看到如下通知。



此次推出的高级语音功能还新增了自定义指令、记忆、五种新声音和改进的口音。它还可以用 50 多种语言说「抱歉我迟到了」。


在下面展示的视频中, 用户和模型在流畅的对话,你可以随时打断聊天内容,彷佛和你聊天的不是机器,而是一个真人。这段 Demo 中的对话内容也特别有意思, GPT-4o 用一口流利的中文说「奶奶对不起,我迟到了,我不是故意让您等这么久的……」,仿佛是 OpenAI 在和用户们道歉,要知道,GPT-4o 可是迟到了将近半年的时间才正式推出。



看在 OpenAI 这么诚意的份上,大家纷纷表示接受道歉。



在下面的示例中, OpenAI 项目主管 Charlotte 通过自定义选项向 ChatGPT 提供了自己的信息,比如名字和住址。然后在新对话中询问了周末可以做的有趣的户外活动。ChatGPT 根据 Charlotte 提供的信息,给出了一些可行建议。



在另一个视频中,OpenAI 负责模型设计的 Drew  表示,他在工作时,会让 GPT-4o 静静地开着,当不与它交谈时它很安静,等有问题时就会提问,然后围绕这个问题会展开一场长对话。大多数情况下,Drew 会把它当作坐在身边的朋友,能为他提供信息,交流想法。



此前,GPT-4o 发布不久,OpenAI 就因其演示视频中名为 Sky 的女性声音与电影《Her》中饰演 AI 恋人的斯嘉丽・约翰逊的声音相似而受到批评。OpenAI 随后删除了该声音。


现在,最新推出的五种新声音分别被命名为 Arbor、Maple、Sol、Spruce 和 Vale,将在标准和高级语音模式下提供。OpenAI 表示,这些声音是使用来自世界各地的专业配音演员制作的。他们采访了数十位演员,他们的声音温暖、平易近人、具有丰富的质感和语调,一位公司发言人表示。



不过,新功能尚未在欧盟、英国、瑞士、冰岛、挪威或列支敦士登推出。


还在休假的 Greg Brockman 也帮忙宣传了一波:「高级语音的推出,让你可以和 ChatGPT 开启流畅的对话,让你意识到在电脑上打字是多么的不自然。」








请到「今天看啥」查看全文