专栏名称: 读懂财经
新三板第一媒体,由资深金融人和资深媒体人创办。
目录
相关文章推荐
洪灝的宏观策略  ·  《洪灝:财政牛不牛(多图)》 ... ·  3 天前  
有限次重复博弈  ·  转发微博-20241011121017 ·  5 天前  
第一财经  ·  超4553只个股下跌! ·  5 天前  
51好读  ›  专栏  ›  读懂财经

大佬点赞、大厂跟进!AI播客,正在引爆音频经济

读懂财经  · 公众号  · 财经  · 2024-10-15 18:57

正文

AI这把火终于烧到了播客。


近期,谷歌开发的AI博客NotebookLM彻底火了。原因是,它能将用户提供的内容进行总结,并生成一段引人入胜的对话式播客,把信息娓娓道来。


国外AI大佬Andrej Karpathy更是称赞其“点亮了LLM的新交互范式”。如今,国内字节的豆包大模型也已跟进。


那么,NotebookLM究竟有哪些有趣的玩法?而当AI进入播客领域,又会对其产生怎样的影响呢?


/ 01 /

解锁使用AI播客的三种姿势


从名称就可以看得出,NotebookLM的定位起初是一款AI云笔记软件。


它基于用户上传的文档内容(包括Google文档、幻灯片、PDF、文本文件、网页链接等),生成长文本摘要、多语言会话、提纲、常见问题解答、学习指南等内容。


到这里,NotebookLM和它的名字一样普通,和别的AI笔记没区别。


要说NotebookLM破圈,全靠生成语音功能,它把小作文变成了超逼真的电台聊天。


使用者尝试了各种玩法,他们把各种书籍、文章、其他播客转成AI短音频。


这才发现,NotebookLM在信息的组织、检索和验证方面做得很好,适合需要精确引用和深入研究特定资料的场景,如学习研究、法律分析、商业报告等。


找到了差异化的使用场景,NotebookLM火也是自然的。


做成一档绘声绘色的播客节目,NotebookLM离不开三个开源模型(Llama 3.1 405B、MeloTTS、Bark),是它们帮助NotebookLM完成从理解文本到生动言说内容的过程:


长文本理解:Llama 3.1 405B擅长处理长文本,能够理解和生成高质量的文本内容。

口语化人声:文本转语音工具MeloTTS,能将输入的文字转化为自然流畅、可定制的声音。

音效:文转音频模型Bark,能生成包括音乐、背景噪音和简单的音效,还有高度逼真的非语言交流,如大笑、叹息和哭泣。


接下来介绍几个AI播客的用法,看看哪一个是你需要:


1、最强AI第二大脑,“信息快餐”开吃


用NotebookLM对论文、书籍、公知社交平台进行梳理总结,并生成逼真生动的人声娓娓道来,效果惊艳。


有人用“股神”段永平的社交主页投给AI,只花5分钟,就做了一档英文播客《段永平的故事》。


也有人对NotebookLM上传了几千条Flomo笔记,一期近20分钟的podcast,讨论了笔记里内容,还能给人以灵感启迪。


这可能是目前的“最强AI第二大脑”产品。


AI播客把原本结构化、线性表达的知识文本,降格成几分钟就能听完的“信息快餐”,就像是用了《三体》中的降维武器“二向箔”。



因为效果过于自然逼真,Andrej Karpathy也给出盛赞,称其“点亮了LLM的新交互范式


2、自我关怀,听老外轮番“彩虹屁”


“如果你感到有点沮丧,把你的社交动态粘贴到NotebookLM中,就能得到一通8分钟的‘真人’深度赞美。”


这是HuggingFace首席科学官分享了用NotebookLM进行自我关怀的方法。(之前我们也写过一个在自我关怀方向的AI产品,SocialAI


把个人社交媒体上的动态/简历导出来,然后复制粘贴给NotebookLM,AI博客里的“人”会对使用者进行狂热的讨论,还甚至讨论起对方的优劣势,以及会不会录用对方的问题。



其实我们每个人最感兴趣的,是自己,所以延续自己的想法和兴趣的内容,充满乐趣和正反馈。


在这个创业机会上,国内已经有大厂出手了。豆包产品经理钟二信在即刻上透露,豆包很快也会上类似的功能。


3、自制英语播客,费曼学习法达成


当老外用AI总结播报论文、制作夸夸的时候,国内却开辟了AI播客的另一个场景——学英语。NotebookLM带动了AI双人英文播客的火爆,小红书上不少博主都在倾情推荐。



有人探索出了一套超棒的英语听力练习法,简直是费曼学习法+自制podcast,制作步骤也非常地简单:


学习:听AI播客讨论(音频约7~18min),进入情景学习
反馈:导入笔记,听AI播客来复盘,内容熟悉,不会走神
调整:自己控制话题难度,再也不怕听不懂


这种学习方法可以让人沉浸地表达和思维。AI播客里一男一女,美式英语纯正清晰轻松幽默,而不是枯燥的英文新闻单向输出。


场景诞生的原因是国人学英语的高需求。我国的英语市场常年火爆,根据数据显示,少儿英语培训市场在2018年就达到3160亿元,成人英语市场规模在2019年也达到了953亿元。


得益于此,中国是访问NotebookLM最多的国家,甚至超过了美国。


/ 02 /

声音短视频化

知识内容生产及消费方式将被改变


一直以来,播客都是一个相对小众的需求。


这和其内容特点有很大关系。与短视频等内容不同,播客内容更侧重于知识输出,内容追求知识密度,因此播客的时长往往较长。


比如,国外头部播客的时长动辄三四个小时,而国内播客小宇宙上,大多数电台的节目时长也在一小时左右。


但这就带来了两个问题:


一方面,时长内容,大幅提升了用户的消费门槛


根据PodcastIndex的数据,当前还在活跃的播客有400万以上。而平均一个人收听播客的时长为6-7小时,这注定有海量的播客内容无法被广泛消费。


另一方面,这也不符合大众内容消费碎片化的趋势


在TikTok上,电影解说账号的点赞量平均在3万左右,爆款可达到百万点赞。


解说型书单视频也大受欢迎,这种号的主要内容是“3分钟内解说一本书”。抖音上像是@不略 这样的号,在只发布30+个作品时,就已经拥有180w万点赞了。



以上两点,使得播客的受众相对受限。


但NotebookLM的出现极有可能改变这一切。


有公式就是快!NotebookLM加快了内容的自动化生产,它将高密度文字内容转化为听觉材料。它还把优质内容变短了,“二创”的知识短音频更符合当下的消费习惯。


同时,AI特有的交互特点,也能实现AI播客的定制化,让知识更入耳入脑。


比如,将特定的阅读材料,用AI处理成更符合自己接收习惯的东西,可以是自己喜欢的声音,又或者双人畅言聊天。


当播客内容的供给被AI进一步放大,且形态更符合用户消费习惯,播客消费仍然很大的挖掘潜力,比如开车、通勤、入睡时,也就是长时间、无注意力(无法用手操作)的场景。


▲来源:即刻@Yangjixxxx


可以想象,随着AI技术的进步,将出现一个更加丰富和智能内容生态。而这或许是内容消费侧潜力最大的机会。



文/朗朗


PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。