专栏名称: 宝玉xp
前微软Asp.Net最有价值专家 互联网科技博主 我是宝玉。
目录
相关文章推荐
爱可可-爱生活  ·  [CL]《SpeCache: ... ·  9 小时前  
爱可可-爱生活  ·  今日推介(第1717期):面向人脸篡改和全合 ... ·  9 小时前  
爱可可-爱生活  ·  【[57星]Nvidia ... ·  昨天  
黄建同学  ·  这个有意思,Gemini AI + ... ·  2 天前  
爱可可-爱生活  ·  本文创新性地提出了 Tiled Flash ... ·  2 天前  
51好读  ›  专栏  ›  宝玉xp

天天炸裂炸麻了😄//@i陆三金:为什么OpenAI这个更新关注-20250321105717

宝玉xp  · 微博  · AI  · 2025-03-21 10:57

正文

2025-03-21 10:57

天天炸裂炸麻了😄// @i陆三金 :为什么OpenAI这个更新关注度不高?语音转录和合成都是很实用的模型、很好的工具,尤其是 openai.fm 这个网站还做的这么好玩
OpenAI 今天又发布了一批新功能,这次是三个音频模型API,个人觉得挺实用。

新音频模型一览
这次发布的API主要分为两类:

1. 语音识别模型(Speech-to-text):
• gpt-4o-transcribe(精准版)
• gpt-4o-mini-transcribe(轻量版)
2. 文字转语音模型(Text-to-speech):
• gpt-4o-mini-tts(支持自定义声音风格)
这些新模型相较之前的Whisper模型,准确率有明显提升,尤其是在有噪音、口音明显或语速变化快的环境下。

价格一览(每百万tokens)
官方也给出了新模型的定价明细,具体如下:

模型名称 文本输入价格 文本输出价格 音频输入价格 音频输出价格
gpt-4o-mini-tts $0.60 - - $12.00
gpt-4o-transcribe $2.50 $10.00 $6.00 -
gpt-4o-mini-transcribe $1.25 $5.00 $3.00 -
从定价来看,mini版本明显更便宜,更适合日常小规模使用,而gpt-4o-transcribe则适合需要更高精准度的专业场景,比如客服中心、会议记录等。

有哪些新亮点?






请到「今天看啥」查看全文