专栏名称: 爱思考的Hardy
前字节跳动策略运营、前快手人文艺术垂类负责人。ai视觉艺术创作者 分享创业过程中的商业认知、个人成长以及流量玩法。
目录
相关文章推荐
洪灝的宏观策略  ·  洪灝:血洗华尔街 美股崩盘,后市如何? ... ·  昨天  
第一财经  ·  深圳近450个“AI+医疗”产品落地 ·  昨天  
21世纪经济报道  ·  邮储、建行、工行集体出手! ·  2 天前  
21世纪经济报道  ·  强制下班!多家企业出手,员工懵了:人生第一次 ... ·  2 天前  
第一财经  ·  意外“跳票”!苹果AI之路遭重挫 ·  2 天前  
51好读  ›  专栏  ›  爱思考的Hardy

三只咩老板喷张一鸣、撕快手,其音频AI造假可能性多大?

爱思考的Hardy  · 公众号  ·  · 2024-09-21 17:03

正文

这是Hardy的第79 篇原创

可能是最懂AI和平台流量生态的内容创作者


持续周更,为你提供多元视角,感谢关注我的账号👇🏻👇🏻


人狂自有天收

现在网上开始疯狂删这个“疑似泄露”的录音。
三只咩涉事女主,出来辟谣是AI克隆,目前其集团的法务真是忙坏了。
不得不说,真的难为死AI了,让AI出来“背锅”。虽然依然无法断定音频就一定不是造假,但这种技术水平,如果能制作出来如此“完美”的音频,这个AI工程师在硅谷至少是300万美刀年薪起步啊。
一共三方大佬,被牵扯进来。这个音频在某音平台上热度直飞冲天,但目前看是被压制了下来。
因为牵涉平台的老板,毕竟音频中,存在喷抖音张一鸣的音频片段,抖音审核一定会第一时间控制热度。
然鹅音频最大的疑点是,到底是谁放出来的,为何冒着如此巨大的风险(无论是法务侵权还是AI仿造),也要公之于众,说明其得到的利益一定是远大于风险。
目前来看,三只咩内部也不是很团结啊,起码这件事对大咩哥、小咩哥是有利的,因为证明了真正的傻X是邢道荣啊。
舆论重点瞬间变化。
所以曝出音频的人大概率是其集团内部,战队大小咩哥的成员,当然也有一种可能是其竞争对手的间谍, 无论如何,没有三只咩背后更大的大佬授意,是万万不得讲卢某在此刻献祭的。


AI克隆出该音频难度有多大?

两大难点证明克隆该音频的难度。

一个是抽卡次数、一个是要同时满足:情绪、断句、背景音、腔调变化、中文口音适配、连续性,六大要素,而且丝毫不能听出破绽及剪辑痕迹。

这尼玛也太难了。

能满足背景噪音的有:OpenAI的Voice Engine,仅需15秒的音频样本即可生成一个接近原声的语音克隆。它不仅能够模仿语气和情绪,还能重现说话时的背景噪音和讲话的动态特征,这些都使得克隆后的声音听起来非常逼真。但它不满足中文口音和情绪。

ElevenLabs的AI语音克隆技术,能够精确复制语音的语调、情感和音量变化。这使得AI可以重现讲话者在不同情境下的特定表现,例如醉酒后的语气变化和情绪波动。但背景噪音和中文口音的难度,试过该软件的铁子应该知道难度。







请到「今天看啥」查看全文