专栏名称: 唐韧

前非著名程序员，现不知名产品人。畅销书《产品经理必懂的技术那点事儿》作者。喜欢聊聊产品、说说职场、谈谈个人成长！

微信，终于说人话了

唐韧 · 公众号 · 互联网短视频 · 2024-11-26 13:05

主要观点总结

本文主要介绍了唐韧关于微信AI声音克隆功能的体验和使用情况。包括如何开启功能、制作过程、声音克隆的效果及反馈等。

关键观点总结

关键观点1: 唐韧的声音被克隆用于公众号朗读文章

文章介绍了唐韧的声音被用于公众号的朗读功能，通过点击文章标题下方的特定图标即可播放。

关键观点2: 制作过程简单，只需录制朗读音频

唐韧体验了声音克隆的过程，只需按照操作提示录制一段朗读音频，系统即可采集声音特征并克隆音色。

关键观点3: AI克隆声音的效果及反馈

唐韧对AI克隆的声音进行了评价，能还原80%的音色，但咬字发音仍有不准确的情况。不同录制方法会影响克隆效果，包括语速、语调、情绪投入。

关键观点4: AI分身的应用及未来展望

唐韧的公众号具备了用其方式自主回答问题以及自主朗读文章的能力，表明AI在公众号运营中的应用价值。同时提到未来可能推出的AI数字人能力，将进一步提升公众号与读者的互动体验。

关键观点5: 产品训练营的信息

文中还提到了本周末举办的线上产品训练营，内容包括直播互动课程、线上课程、一对一辅导等，为产品经理提供学习机会。

正文

你好，我是唐韧。

别意外，这个开头完全是为了配合今天这篇文章，因为你可以听到我的声音来朗读全篇内容。

方式很简单，你只需要点击文章标题下方蓝色字体后面那个耳机图标就可以开始播放。

如果你上过我的课或者看过我的直播，可以对比一下这个声音和我的原声是否一致。

如果这是你第一次听到我的声音，也别意外，因为这就是我的声音。

前几天我在公众号接入了腾讯元气的 AI 智能体，成功创造了唐韧的 AI 分身，它可以学习我的历史文章来回答一些读者的问题。

现在，我每天都能在后台收到各种各样的提问，AI 分身回答质量目前能打个 70 多分。

腾讯总共给我送了 1 亿 token，目前已经消耗了 263 万，所以你们还可以继续和我聊。

但是这个能力并非微信团队自己做的，不过今天介绍的这个 AI 声音克隆能力就是微信自家的产品了。

这个功能目前还处于灰度测试阶段，在官方订阅号助手 App 里可以选择开启。

让 AI 克隆我的声音非常简单，只需要按照操作提示录制一段朗读音频就可以。

朗读的文案可以选择默认的，系统也会从历史文章里进行截取，这一步主要是采集声音特征。

录制结束后，AI 就会复制音色，大概几秒钟就完成了。

克隆成功后，我就可以在后台选择让系统用我自己的声音朗读文章。

那么，实际效果怎么样呢？

就我自己的听后感受来看，能还原个 80 分左右，主要体现在音色上，但是一些咬字发音还是有不准确的情况。

这里的差异，估计跟采样太少有关系。

不知道你们听完后感受怎么样，听过我真人说话的觉得还原度高不高？

这里还有特别说一下，我在录制阶段其实尝试过不同的录制方法，包括语速、语调、情绪投入。

以下面这个语料为例。

在录制这个例句时，我开始是用比较平缓的方式朗读，结果 AI 克隆出来的声音就有一种比较强的机械感。

接着我换一种带起伏节奏的方式朗读，这次 AI 克隆出来的声音就明显生动很多。

然后我觉得语速有点慢，又在第二种朗读方式的基础上加快语速录制了一遍，也就是你们现在听到的这个声音。

就几次实验情况来看，最后录制的这个效果是比较符合我预期的。

这里也可以看出，AI 克隆声音并不是机械复制，就像产品提示里说的那样，语气和情感也会被复制。

这一点，就和传统的 TTS 模式有很大不同。

我看了下历史文章的朗读数据，其实平时听文章的人还是少数，不知道这个带我声音和语气的「听文」功能会不会提升这方面的表现。

从此，在 AI 的加持下，我的公众号具备了用我的方式自主回答问题以及自主朗读文章的能力，这是一个巨大的进步。

以前我也说过，我在这里写文章就是跟读者的一种交流，分享我的所见所闻和所思所想。

如果过去我们只能见字如面，那现在就可以做到听声识人。

接下来，就看微信什么时候推出 AI 数字人能力了，或许那时候我们就可以每天「见面」了。

使用 AI 克隆完我的声音后，我让几个朋友试听了一下，其中一个朋友的反馈我觉得亮了。

他说：「微信终于说人话了」。

推荐阅读：《干这个，年入千万？》

················· 唐韧出品 ·················

▲ 点击上方卡片进入发消息回复“w”，可加我个人微信

关注唐韧，用产品思维洞察现象背后的逻辑