专栏名称: 数字生命卡兹克
反复横跳于不同的AI领域,努力分享一些很酷的AI干货
目录
相关文章推荐
读嘉新闻  ·  集体爆发!飙涨! ·  昨天  
读嘉新闻  ·  集体爆发!飙涨! ·  昨天  
7M投资笔记长文  ·  今天注意!!! ·  2 天前  
淘股吧  ·  根据市场的盘面去做 ·  3 天前  
51好读  ›  专栏  ›  数字生命卡兹克

10秒钟复刻AI付航吐槽一切,这就是现在最好的TTS声音克隆。

数字生命卡兹克  · 公众号  ·  · 2024-10-21 09:30

主要观点总结

文章主要描述了作者观看脱口秀和LOL S14总决赛的经历,以及使用F5-TTS声音克隆技术让AI付航吐槽TES的有趣体验。文章还探讨了脱口秀作为当代“精神布洛芬”的作用,并表达了对付航和TES的期望。

关键观点总结

关键观点1: 作者观看脱口秀和LOL总决赛的体验

作者同时观看《喜剧之王单口季》和LOL S14总决赛,感受到心态过山车式的体验,对脱口秀演员付航的表演印象深刻。

关键观点2: 使用F5-TTS声音克隆技术

作者利用F5-TTS声音克隆技术让AI付航吐槽TES,对F5-TTS的效果感到惊喜,音色和劲都与真人付航相似。

关键观点3: 对脱口秀的看法

作者认为脱口秀是当代的“精神布洛芬”,能够让人们开心,喜欢付航这样的演员和脱口秀这种形式。

关键观点4: 对TES的期望和对比赛的看法

虽然TES输得难看,但比赛的过程很有趣,作者期望S14决赛时LPL的表现能够像付航的脱口秀一样让人开心,呼吁观众放松心态看待比赛。


正文

上周末 ,我追了两个月的脱口秀,终于总决赛了。
周六我一边看LOL S14总决赛,一边看《喜剧之王单口季》,真就体会了一把什么叫心态过山车。。。拉的很拉,稳的很稳。
好在脱口秀这边,我一直很喜欢的演员付航,不负众望地拿到了总冠军。决赛这场他还是“Passion”到极点,劲儿给得太足了。

这场的段子和表演都太NB。给我看的笑中带泪,真的。
付航的表演给我的感觉就是纯粹的好笑,不需要你绞尽脑汁去思考什么“上价值”。看了就想笑,笑完还想再看,好笑本身就足够有价值。
看付航夺冠我呲着的大牙还没收回去。一转头看LPL那边,瞬间失去所有力气和手段。付航的Passion要是能借TES一点,也不至于让我看得这么无语。
0:3,直接被暴虐。被飞科按在脚底下摩擦。
太小丑了。。
知乎和微博更不用说,当晚看比赛的全在吐槽和破防,逛超话都给我看笑了。
就在那一瞬间,我脑子里冒出了一个很有趣的点子: 要是能让付航,帮我狠狠吐槽TES,简直完美就是完美的联动。。。
可惜我抢不到付航线下脱口秀的票。更不认识他。。。
但是,咱有AI啊。
那,说干就干。
效果大概就是这样的。
让我们☝️说中文👐!
这语气这效果,离川普就差一个手风琴了。
这把,就用F5-TTS,直接让AI付航当当我的嘴替吧。
F5这玩意牛逼就牛逼在只需要15秒,就能克隆任何声音,最关键的是,还是开源的,免费本地就可以跑。
而且使用贼简单,你也可以跟着手搓一个AI声音替你吐槽。
当然,为了大家能上手即用, 我们也给大家做了整合包,配好了环境,下载好了各种需要到的模型,大家可以一键部署使用。
你对着公众号私信"F5"就自动有下载链接了。
并且相比于原版的UI,我们也给大家做了汉化,方便大家使用(其实是我自己看不懂英语。。。)
首先下载完,解压压缩包,得到完整目录如下。
然后点击  一键运行.bat,终端会自动跳出。
稍等片刻,即可看到一个链接。
按住Ctrl 并单击进行访问,就能进到F5的界面里面了。
点击上传参考音频,即我们想要克隆的人的音频,这里我用了付航喜剧之王里的一段12秒的音频。音频不是越长越好,一定得15秒以下才行。
然后在待生成文本里面填自己想要生成的文字内容,比如之前鲜虾包 谬赞我文章的一段话。
最后选择F5-TTS模型,点击合成即可。
这样就可以得到鲜虾包以付航的口吻称赞我文章的passion了!!!
是不是巨简单,是不是有手就行。
但是跑明白了声音克隆的流程,我们还缺一段最重要的东西,就是,文本。
说实话,我自己写段子的水平可能连小学生都够呛,所以我果断选择求助了Claude老师。
我把付航在《喜剧之王》的视频转成文字稿,一股脑儿塞给了Claude。想着让它学着付航的风格写一段脱口秀试试。
然而。。。我roll了N次,Claude就是没法做到付航那个味儿。
想着可能长文本脱口秀不好写,换个风格用one-liner吧,写了一段Prompt。
给了特点、节奏、杨波曾经的case。
又试了好几次。
效果还是很难评。。。
说实话,连Claude都只能做到这种程度,我根本不想试其他的大模型的效果了,没有意义。
不过可能也是脱口秀这个形式确实复杂了一点。现在的大模型还是太直率了,写的内容坦率的讲都是生拉硬拽拼在一起,效果比僵尸都硬。
脱口秀这样文雅人的吐槽不太行,感觉还是得直接骂才有效果。
于是我又扒了篇知乎分析TES比赛的文章,写了一段比较不太能放出来给大家看的Prompt,让Claude给我整了一段。
这次火力直接拉满了。。。
还得是直接吐槽开骂啊。
然后我就直接把这篇稿子,拆分了一下,一小段一小段的,扔回到我们刚才的F5里。
就,出现了这样的效果。请大家欣赏,AI付航吐槽TES。
说实话,这个效果,有点过于直白过于狠了。。。
当然那个笑声是我后期加的,为了模仿一下脱口秀现场的效果。
F5出来的音频,音色跟付航真的一模一样,那个劲,也非常的像。还有些停顿、叹气,简直跟真人一样,虽然说表演和情绪跟付航自己比肯定是一个天一个地,但是AI能跑出这种程度,我已经很欣喜了。
就是有个小技巧大家在用的时候需要注意一下,F5支持中英文,但是不支持数字,这个点就非常的尴尬,所以你需要把数字处理一下变成中文。
比如,369,变成“三六九”。F5就能正常识别了。
大家有啥想整的活,都造起来吧。






请到「今天看啥」查看全文