专栏名称: 商学院
《商学院》杂志由中国社会科学院主管,中国社会科学院工业经济研究所主办,《中国经营报》社有限公司出版。在这里你可以直通全球22家知名商学院校,这是一座开在你身边的《商学院》。
51好读  ›  专栏  ›  商学院

AI商业洞察 | OpenAI 升级语音转录与合成 AI 模型,提升可控性与准确性

商学院  · 公众号  ·  · 2025-03-25 13:24

正文

请到「今天看啥」查看全文




AI+商业
Artificial Intelligence & Bussiness

OpenAI 升级语音转录与合成 AI 模型,提升可控性与准确性

近日, OpenAI 推出了全新的语音转录与合成 AI 模型,并将其集成至 API 中,旨在进一步提升语音交互的自然度和可控性。这一举措与 OpenAI 的“智能代理”( Agentic )战略相契合,即致力于打造能够独立执行任务的 AI 代理。


新版文本转语音模型“gpt-4o-mini-tts”在语音表现力上实现了显著提升,支持用户根据需求调整语调,例如可以模拟“疯狂科学家”或“冥想导师”等风格。OpenAI 认为,允许开发者自定义语音的情感和上下文,如在客户服务场景中表达歉意,将极大地提升用户体验。


此外,OpenAI 还推出了“gpt-4o-transcribe”和“gpt-4o-mini-transcribe”两款新模型,以替代原有的 Whisper 模型。新模型在嘈杂环境中对口音和多样化语音的识别能力更强,同时有效减少了错误生成(幻觉)的问题。相较于过去 Whisper 模型可能凭空编造文本的情况,新模型显著降低了这一风险。


值得注意的是,尽管新模型在多数语言上的表现优异,但在部分语言(如泰米尔语、泰卢固语等)上的错误率仍较高,约为 30%。此外,OpenAI 此次并不计划开源这些转录模型,表示这些模型的规模远超 Whisper,不适合本地运行,未来将更加慎重地推进开源计划。


英伟达联手电力行业,以AI应对AI引发的电网挑战

3月21日,英伟达宣布与电力行业研究机构EPRI达成合作,将共同利用AI技术来应对电网面临的挑战。颇具讽刺意味的是,这些挑战在很大程度上源于AI计算需求的激增,进而导致了电力消耗的飙升。


此次合作是“开放电力AI联盟”(Open Power AI Consortium)的一部分,该联盟汇聚了多家电力公司(如PG&E、Con Edison、Duke Energy)以及科技公司(如微软、Oracle)。联盟计划开发专用的AI模型,以优化电力管理,并将这些模型开源,供学术界和产业界共同使用。


随着AI计算需求的不断增加,全球数据中心的耗电量也在急剧上升。据国际能源署预测,未来电力需求的年增速将达到4%,几乎是2023年的两倍。为了应对这一挑战,科技公司正在竞相签署可再生能源采购协议。以微软为例,该公司近期新增了475兆瓦的太阳能发电能力,并投资了90亿美元支持可再生能源项目,计划到2030年在美国和欧洲部署10.5吉瓦的绿色电力。


除了增加发电量,优化电力调度也是缓解电网压力的关键。研究表明,通过在高峰时段限电,并将非紧急任务调整至低谷时段,美国电网可以额外释放76GB的容量,占峰值需求的10%。预计“开放电力AI联盟”将探索包括负载管理在内的多种AI解决方案,以提升电网效率,并努力缓解当前的能源危机。


微软新增 475 兆瓦太阳能电力 以满足 AI 数据中心需求

近日,微软再次加大在可再生能源领域的投入,新增了475兆瓦(MW)的太阳能电力,以满足其AI数据中心日益增长的能源需求。该公司与能源供应商AES签署了协议,将在伊利诺伊州、密歇根州和密苏里州启动三个太阳能项目。


近年来,微软持续扩大太阳能采购规模。今年2月,公司已经从伊利诺伊州和德克萨斯州的三个太阳能项目中获取了389兆瓦的电力。此外,去年微软还宣布成为Acadia组织的90亿美元可再生能源联盟的核心投资方。目前,微软的可再生能源装机容量已经超过了34吉瓦(GW)。


虽然核能因其稳定性而备受关注,但太阳能因其成本低、安装快、模块化等优势,仍然是科技公司的首选。为了提高供电的稳定性,开发商正在将太阳能与电池储能相结合,以实现全天候供电。尽管这种混合电厂的模式比单独的太阳能或风能更昂贵,但由于太阳能和电池成本的持续下降,这种混合电厂已经开始在价格上接近天然气发电。


当前,随着AI计算需求的激增,预计到2027年,全球近一半的AI服务器可能面临电力短缺的问题。相比核能和天然气电厂,太阳能项目的建设周期更短,仅需约18个月便可并网发电。因此,微软去年与Brookfield资产管理公司达成了协议,计划在2030年前交付10.5吉瓦的可再生能源,进一步确保其数据中心的能源供应稳定。


开源数据流动公司Airbyte推出新数据连接器,助力企业安全高效管理数据

近日,开源数据流动公司Airbyte宣布推出一系列新连接器,旨在帮助企业在AI时代高效管理数据,同时确保数据主权不受侵犯。


该公司最新发布的功能亮点包括:支持从Google Drive、SharePoint等应用中提取非结构化数据,并兼容Apache Iceberg这一开源数据湖格式,使企业能够更灵活地存储和分析数据。此外,Airbyte还推出了企业级数据连接器套件,全面覆盖NetSuite、SAP、ServiceNow和Workday等企业应用的数据管道,满足企业多样化的数据管理需求。


Airbyte联合创始人兼CEO Michel Tricot强调,这些新功能使企业能够完全掌控数据流向,有效避免SaaS应用泄露敏感信息。例如,企业可以在数据传输前剔除薪资等敏感信息,从而大大降低数据外泄的风险。Tricot还警告称,企业不应轻易将一方数据交给第三方AI模型,以防信息泄露造成不必要的损失。


他特别指出,Iceberg兼容Databricks、Bitquery、Snowflake及新兴AI应用,可帮助企业构建统一的“数据湖仓”(Data Lakehouse),实现多平台数据的无缝互通,进一步提升数据管理的效率和灵活性。


值得一提的是,Airbyte成立于2020年,目前已拥有7000多家企业客户,包括Monday.com、Invesco、Calendly等知名企业,并完成了超过25万次的安装。此外,公司已从Coatue、Accel、Benchmark等风投机构融资1.81亿美元,为未来的发展奠定了坚实的基础。


Meta AI登陆欧盟,功能受限,监管争议持续存在

近日,Meta宣布其AI助手Meta AI已正式进入欧盟市场,但相比美国版本,欧盟版本的Meta AI在功能上有所限制。该AI助手将被集成至WhatsApp、Instagram、Messenger和Facebook等应用中,并支持英语、法语、西班牙语、葡萄牙语、德语和意大利语六种欧洲语言。


此次发布受到了欧盟严格的隐私法规(GDPR)的约束。Meta过去曾尝试使用用户数据来训练AI,但因未能获得有效的法律依据,而遭遇了欧盟监管机构的阻挠。去年5月,Meta曾通知欧洲用户其AI训练政策的变更,但在6月因爱尔兰数据保护委员会(DPC)的介入而被迫暂停了该计划。此次推出的Meta AI并未使用欧盟用户数据进行训练,因此无需额外通知用户或征求同意。


尽管英国已经脱欧,但仍遵循与GDPR相似的数据保护标准。去年,英国信息专员办公室(ICO)要求Meta暂停其AI训练计划。随后,Meta调整了用户数据的退出机制,并在2023年10月先行在英国推出了Meta AI。然而,Meta并未明确说明是否已使用英国用户数据进行训练。


目前,在欧盟地区,Meta AI仅作为智能聊天工具提供,用户可以在群聊中通过@MetaAI提问,但该工具并不提供个性化推荐或AI生成图像等高级功能。Meta强调,此次推出只是“迈出的第一步”,未来他们希望实现与美国版AI功能的同步。然而,这也意味着Meta仍将与欧盟监管机构展开更多的博弈和协商。







请到「今天看啥」查看全文