本文介绍了谷歌的NotebookLM产品,及其所代表的新型交互形式。这种形式可能触及LLM产品的全新领域,类似于ChatGPT的新范式。文章指出,AI的价值目前主要集中在生产力层面,但作为一个工具其价值有限。而NotebookLM看到了内容消费的机会。文章还分析了ChatGPT如何帮助LLM破圈,以及新的AI产品范式是如何发展的。此外,文章还提到了其他产品如Perplexity和Nothing Phone的功能特点,以及它们与新的AI交互范式的关联。最后,文章展望了未来的AI交互范式,包括各种模态的转换和融合。
谷歌的NotebookLM产品代表了一种新型的交互形式,可能触及LLM产品的全新领域,类似于ChatGPT的新范式。
Karpathy看到NotebookLM蕴含的内容消费机会,意识到需要文字类工具的人虽然少,但内容消费市场潜力巨大。
ChatGPT将GPT-3.5模型包装成对话界面,帮助LLM突破局限,证明了对话形式对解放LLM能力的重要性。
新的AI产品范式涉及将庞大文本内容转换为其他模态内容以满足更多用户消费场景的需求。例如,Perplexity和NotebookLM等产品功能体现了这一范式的发展趋势。
昨晚Andrej Karpathy介绍了一下谷歌的 NotebookLM,之后还说这个产品所代表的交互形式可能触及 LLM 产品的全新领域,是一个类似 ChatGPT 的新范式。
大家也都知道目前 AI 的价值主要集中在生产力层面,也就是工具属性比较重,主要辅助用户生产内容。
工作流程是用户向 AI提出问题,AI 给出意见,用户基于意见修正和整合,产生新内容。
但是作为工具来说他的价值是有限的,因为需要文字类工具的人非常少,无法快速形成规模效应。
目前比较赚钱的业务都是涉及内容消费的,比如抖音这类 PGC 内容生产和分发工具。
Karpathy 正是看到了 Notebook LM这个产品中蕴含的内容消费机会。
ChatGPT 为什么可以帮助 LLM 破圈
他说 Notebook LM 可能蕴含着类似 ChatGPT 这种机会,我们来看 ChatGPT 解决了什么问题。
其实 GPT-3 的模型已经具备相当的能力了,但是发布相当长时间没有出圈,不被人注意。
ChatGPT 将 GPT-3.5 包装成一个对话界面,突然就出圈了,直接开启了这一轮 AI 大战的序幕。
对话形式一下解放了 LLM 的能力,让人们意识到到了他的全能和开放性,也给了用户一种错觉和暗示,那就是 LLM 真的是具有智能的,我在跟一个真的意识在聊天。
所以说一个与当前 AI 发展阶段匹配的交互形态对于推广产品和模型能力是非常重要的。
从 Perplexity 和 Notebook LM 看新的 AI 产品范式
在总结新的范式之前我们来看这个范式两个典型的产品功能表现的例子。
Perplexity 的发现页
Perplexity 最近对他的发现页进行了大改版,我说他们在创造一个更强的今日头条,估计他们 CEO 也是因为这部分分析关注我的。
AI 会自动在互联网上搜集和检索信息,然后综合各个信息源整合成新闻页面,可以根据你选择的主题给你推荐,在移动端表现为类似抖音的上下滑形式。
页面的新闻内容会被翻译为用户当前使用的语言,比如你的界面是中文,新闻内容就也是中文。
另外你可以在这个页面点击按钮直接收听今天的所有新闻,也可以在新闻页面单独收听这一条。
另外 Nothing Phone 也有个类似功能是一个桌面小组件,长得像收音机,点击之后他们公司 CEO 就会给你播报今天的新闻。
NotebookLM 的对谈播客
Notebook LM 是谷歌的一个产品你可以上传文件(文字、音频、视频)之后,AI 会帮你总结成文字内容而且可以提问相关信息。
他们最近上线一个功能,可以将你上传的文件总结为一个双人对谈的播客,解放了你的眼睛,可以直接收听这个上传内容的总结,也可以讲生成的播客内容分享给其他人。
NetebookLM 代表的新 AI 交互范式是什么
NotebookLM 播客功能为代表的产品功能代表的新 AI 交互范式:
就是将已有的庞大文本内容利用日渐成熟的其他模态 AI 模型转换为更多可被用户消费的内容形态,从而满足更多的用户消费场景。
Perplexity 的发现页面将全世界大量不同语言的新闻内容重新整合,变为可以被不同语言消费的新闻信息流,同时 TTS 的加入让用户的消费场景获得了极大的拓展,可以不用盯着屏幕了。
NotebookLM 将用户感兴趣的长篇文字内容拆解、总结、整合,让其更符合用户消费习惯,播客的加入也让整理内容的消费场景获得了拓展,另外对谈的形式也避免了让用户提问题这个成本很高的动作。
这一范式的主要特点是:
•
AI 自动收集整理文本内容
•
将原始文本内容转换为可被消费的其他模态内容
主要的解决了下面这些问题:
•
拓展内容消费来源:不同语言不同地区的内容都可以被消费。
•
拓展内容消费场景和形式:同一份内容可以被变为图文、单口播客、对谈播客、视频。
•
降低内容消费成本:长篇深度内容可以被结构为简单的、简短的内容供用户消费。
这一范式实现的前提只有一个: