2024年11月5日,The Information报道,Perplexity新一轮融资即将完成,估值将达到90亿美元,IVP正在洽谈该轮5亿美元投资。这是Perplexity 2024年第4轮融资,IVP此前已经对Perplexity进行多次投资,包括2023年领投B轮融资。
Perplexity当前年化收入ARR约5,000万美元,高于2023年10月250万美元。2023年,Notion、X、OpenAI都曾有意收购Perplexity,甚至微软表示相当的兴趣。
2024年10月30日,TechCrunch发布Perplexity
CEO Aravind Srinivas专访,Aravind Srinivas就Perplexity面临剽窃指控、与传统搜索引擎差异、功能扩张策略、与新闻媒体机构关系、版权争议等问题进行深入讨论。Aravind Srinivas表示,将通过广告收入分成与新闻媒体机构合作,而非传统授权模式,表达从Google等巨头手中争夺广告收入份额雄心。
2024年10月18日,
Youtube频道
Jim Rutt Show发布Perplexity CEO Aravind Srinivas专访,深入探讨Perplexity独特搜索引擎技术。Aravind Srinivas强调,Perplexity在提供有争议问题上多角度观点的勇气,讨论Perplexity技术架构、商业模式,分享Perplexity未来展望,包括扩展到更多垂直领域与个性化服务,在融资、增长方面策略。
本期长期主义,选择Perplexity CEO Aravind Srinivas两次专访纪要,瓜哥AI新知发布,六合商业研选精校,分享给大家,Enjoy!
Perplexity
CEO
与资深编辑激辩剽窃指控、瞄准搜索广告商业模式
Perplexity
CEO Aravind Srinivas接受TechCrunch 专访,2024年10月30日发表在Youtube频道。
对剽窃的定义、与Perplexity
AI应对策略:
Srinivas探讨剽窃的定义,强调Perplexity AI一开始注重引用来源,避免剽窃。承认模型并非完美,可能出现意外复制情况,他们通过指令模型、监督微调等方法尽量减少这种情况。他们认为Perplexity AI与直接复制粘贴内容的产品不同,目的是总结信息,而非复现原文。
与传统搜索引擎,例如Google差异:
Srinivas指出Perplexity AI与Google等传统搜索引擎根本区别,在于侧重直接回答问题,而非仅提供链接。Perplexity
AI用户提问,通常更长、更具体,Google用户倾向使用简短的关键词进行搜索。他们认为两种引擎,满足不同用户需求,并非简单替代关系。
Perplexity
AI
功能扩张与策略:
Srinivas解释Perplexity
AI快速增加新功能,如体育赛事比分的策略,强调他们根据用户需求与使用日志来确定开发优先级,目标是覆盖更多日常使用场景,吸引更多用户,最终形成用户习惯的转变。
与新闻媒体机构关系与版权争议:
Srinivas回应与道琼斯公司版权诉讼,解释他们对内容窃取指控的回应,提出Perplexity
Publisher Program,旨在通过广告收入分成方式与新闻媒体机构合作,而非传统授权模式。他们认为Perplexity
AI并非与新闻媒体直接竞争,而是提供补充性的信息获取方式。
盈利模式与未来发展:
Srinivas阐述Perplexity
AI盈利模式,包括订阅服务与未来广告收入分成。他们承认AI技术成本高昂,随着技术进步,成本会下降,将为公司发展提供更多机会。他们表达从Google等巨头手中争夺广告收入份额的雄心,也承认这需要时间与努力。
移民问题与个人经历:
Srinivas分享自己作为创业者在美申请绿卡经历,呼吁关注美国移民体系中存在的挑战。
Perplexity
CEO Aravind Srinivas
Aravind
Srinivas是AI初创公司Perplexity AI联合创始人、CEO,Perplexity AI致力打造答案引擎,旨在提供更便捷、更智能信息访问方式。
Srinivas拥有丰富机器学习研究背景,在加州大学伯克利分校获得计算机科学博士学位,师从图灵奖得主David Patterson,博士研究专注高效深度学习训练方法。
Srinivas之后转入工业界,曾在谷歌大脑实习,担任过OpenAI研究科学家。他在Google经历,不仅加深他的技术专长,还为他提供宝贵见解,让他了解 AI 在现实世界中实际应用。OpenAI期间,Srinivas参与包括GPT-3、DALL-E
2、CLIP等重要项目的研发。
Srinivas深信AI变革力量,2021 年,与人共同创立Perplexity AI,创立Perplexity AI初衷是希望将复杂信息以易于理解方式呈现给用户。他认为,未来搜索引擎,不应仅提供链接列表,应直接提供准确、简洁答案。
他领导Perplexity
AI开发基于大型语言模型的答案引擎,该引擎能够理解自然语言提问,从海量信息中提取关键信息,直接给出答案,极大提升信息获取效率。
Srinivas是备受关注的科技新星,目标是利用AI技术,让信息获取更加便捷、可靠。他认为,未来每个人都将拥有自己AI助手,帮助他们学习、工作与生活。
让我直接问你一个问题,我想了解一些真实情况。Perplexity对剽窃定义是什么?你们肯定有定义,也许是这样,也许那样。我很想知道,你们必须有一个定义,除非你们不是意外进行剽窃。
Aravind
Srinivas
:
你可以直接问Perplexity这个问题,这是获得答案最佳途径。这并非Perplexity的定义,而是剽窃的定义究竟是什么?
Perplexity总是引用来源,对任何内容都不声称拥有所有权,只是从网络上提取内容,以用户可以理解方式进行总结,提供信息来源。类似记者完成他们工作、学者完成他们工作、或学生撰写论文一样,只要有参考文献与引用部分。
主持人:
这个意义上,学术角度说,他们会创作一份原创文件,他们使用引文来创作原创内容。
Aravind
Srinivas
:
有时当某个新闻机构率先报道新闻,另一个新闻机构报道同一条新闻,提到这是由某某首次报道,算不算剽窃?
主持人:
当我引用某人的话时,我会用引号括起来,我会说这是他们说的。
CopyLeaks最近进行一项研究,他们发现Perplexity能够看到一篇文章时,它通常会连续使用文章中 8、10 或 15 个单词,它会在一个小卡片或类似东西中引用这篇文章。
Aravind
Srinivas
:
来源位于顶部一个来源面板中,每个句子结尾,都有一个脚注或它从中提取信息的相应页面。它不十分精确,并非每个句子都与完全正确脚注相关联。
为了非常清楚起见,我们 2022 年 12 月 7 日推出,差不多2年前。当时,全世界都痴迷 ChatGPT,它早7天推出。
我们是唯一一款表明参考文献与引用很重要的AI产品,其他产品只是获取模型中吸收的所有网络内容,没有标明来源。
从一开始,我们就重视这一点,在你说的方面不断改进。例如,使正文中更清楚表明这部分内容来自该来源,我们正在尽最大努力做这些事。
主持人:
我相信你,你拥有学术背景,我真的相信这是你首要任务。
我知道,自从你们一开始就加入引文,表明不仅是说说而已。
我问这个问题的原因,不仅是为刁难你,而是你必须理解或定义剽窃,才能说,我们不想剽窃。
如果我要在我文章中复制粘贴某些内容,我会知道我在剽窃,我会为此感到难过,这就是我为什么不这样做。
理想情况下,你希望你的模型不要这样做。它必须知道,或者有人必须知道,必须有一个监督模型,类似你在这里复制粘贴一点。有没有这种监督?我们可以之后再讨论这个问题,我问这个问题是有原因的。
Aravind
Srinivas
:
它是这样工作的,模型被指示不要提供任何特定来源的任何精确文本,而是提供摘要,摘要结合所有不同观点,直接点明用户重点,不是复制网上任何内容。
随着模型在指令遵循这项技能上不断改进,这个特定的指令执行得越来越好。
AI领域,通常被称为监督微调SFT、或来自人类反馈的强化学习。我们不是进行所有模型训练的人,我们采用其他开发者与例如开源模型 LLAMA的其他模型,没有哪个模型是完美的。
你将能够通过提示工程或提示注入,来让任何现有模型执行与其最初被指示执行不同的操作,整个过程被称为提示注入。
主持人:
如果我只是说,总结一下这篇文章,正如已经显示的那样,有时你会发现它会取一句话。
Aravind
Srinivas
:
这不是我们产品的预期用例,我们产品旨在回答问题。有些人试图以我们不希望他们使用方式使用它,例如为我总结这个 URL,然后他们粘贴 URL。
Aravind
Srinivas
:
我意思是,我们不允许那种特定用例,我们尽最大努力避免那种指令。
再说一次,AI领域中几乎没有人能声称,我总能防范某种特定用例。你总能找到一种新的方式来进行提示工程,让最初构建的安全护栏失效。
你从中学习,随时间推移解决这个问题。某个时候,它足够安全到可以部署,它不会执行任何你指示它以非预期方式使用的指令。
关于AI驱动、AI原生搜索的整体概念,我们看到一些公司在做这件事,我觉得最突出的是,我们都知道谷歌过去10年里,一直在让搜索变得复杂与低效,添加摘要、小工具与AI功能。
在我作为科技记者的整个职业生涯15~20年中,这可能是对主要平台最普遍不受欢迎的改变之一。
感觉有些公司就像,“我喜欢你在做的,谷歌“,你们只是决定从他们停下的地方继续吗?你们认为自己可以做得更好?
Aravind
Srinivas
:
我认为,谷歌根本上是一个基于链接的搜索引擎。无论他们是否喜欢给出答案,这才是赚钱的方式。
即使在昨天财报电话会议上也提到,他们每个季度通过搜索广告赚取450亿美元,这对他们业务至关重要。
我认为,即使他们没有细分利润率,利润主要来自让你点击链接。他们有动机向你展示尽可能多链接,即使这种AI摘要开始至少满足某些信息查询的需求,这并不是主要使用模式。
例如,在他们每天可能有50亿~80亿次查询中,大多数查询没有用到AI摘要,这就是现实情况。如果不是这样,肯定会扰乱他们营收模式。
我们试图做的是谷歌主页,或者至少是谷歌搜索栏,不是一个用来直接提问的地方。谷歌查询的平均词数在2~3个词之间,确切数据很难确定,人们估计大约是2.7个词;而在Perplexity,大约是10~11个词。Perplexity主要使用方式,是人们直接提出问题。
另一方面,谷歌上,你输入几个关键词就能立即找到某个链接。你仍然使用谷歌来查找例如名人年龄、正在进行比赛的比分,或者旧金山天气。这些都是你输入两三个单词,立即寻找答案的使用模式。
你可以争论说,Perplexity与谷歌,两种不同产品都应该满足这种用例,最终,人们都想要即时信息。除此之外,这两种产品完全不同。
首先,过去两周,你在X/推特上疯狂发布各种用例与功能,我已经看到大约50个。你刚才提到,比如比赛比分,你刚在Perplexity添加比赛比分。
Aravind
Srinivas
:
目前只有NFL美国橄榄球联盟。
主持人:
你们是直接从NFL获取数据,还是抓取其他网站数据,或者是什么方式?
Aravind
Srinivas
:
我们与一家体育数据提供商签订数据合同,我们使用这些数据,类似谷歌也做的那样。没有人直接抓取比分,很难确保准确性。
主持人:
这是人们在写,你知道的,比如海鹰队今天比分?还是他们说,给我看最近20场NFL比赛的比分细目之类?
Aravind
Srinivas
:
我想更像是后者,最终我们希望Perplexity成为你可以提任何问题的地方,我们有责任给你准确的答案。
很明显,我们找到最初的用户群体,每个人在一开始都会找到特定的一批用户与用户群。
Facebook最初在学生群体中很流行,亚马逊最初服务图书市场,类似早期互联网真正迎合学术界人士,构建知识库的人一样,AI领域也是如此。
Perplexity最初非常受许多这些学术、研究导向、知识导向人的欢迎,这是我们围绕它建立品牌的理念。
我们希望扩展到整个地球,每个人都应该能够问任何关于任何事的问题。
体育是一件你可能认为与知识无关的事,有很多体育迷,喜欢深入研究数据、分析比赛、试图了解更多关于特定球员或球队信息,或者成功概率、预测,如果你没有真正关注比赛,那么比赛的总结。
我们认为我们提供的不仅是实时比分,这就是为什么当我们推出实际比赛评论摘要与球员级别比较、球队级别比较,以及更细致信息时,许多人会喜欢这些内容,如果他们关心这个垂直领域的话。
主持人:
类似我说的,这只是你推出的大量功能中的一个,比如,你现在可以这样做。
这里面有什么策略?还是说你们只是采取一种散弹枪式的方法,类似我们要推出10种不同的产品, 3种会成功,你们是在试图找到对用户真正有价值的产品吗?
Aravind
Srinivas
:
我们真的会查看日志,看看人们在要求什么。
在体育之前,我们优先考虑金融领域,我们在商业与金融垂直领域有很多用户。他们正在研究市场、投资组合管理,或者与加密货币相关新闻,或者其他投资者投资策略,只是试图了解不同股票、与股票相关新闻。
我认为人们试图理解这个世界,我们会查看日志,看看我们可以在哪方面做得更好,我们可以在哪些方面提供不仅是一堆文本,我认为这真的很重要。
体育是人们发现我们出现过几次幻觉的地方,比如当我们无法提供比赛准确比分时。它是这样的,如果我们确保可以覆盖人们在现有搜索引擎上已经习惯的许多垂直领域,他们就没有理由再回到传统蓝色链接界面,这就是我们的目标。
如果你想改变习惯,并不容易。这是一种有20~30年历史的习惯,就是去一个有十几个蓝色链接的搜索引擎。如果这应该是一种改变,如果这应该代表未来,我们必须赢得它。
我们必须真正努力覆盖你的日常用例,而不仅是帮助你进行内部搜索。如果你正在进行软件开发,或者帮助你进行研究规划,或者你的学术研究、财务研究,我们必须做所有关于本地搜索的枯燥工作,比如体育、天气、购物、旅行,这就是我们决定优先级的方式。
主持人:
你面临一场诉讼,是道琼斯。他们称Perplexity为内容盗窃统治者,我觉得这个说法挺强烈的。
你公开回应说,媒体公司希望这项技术不存在。我认为这不属实,你们与《财富》、《时代》杂志有合作协议,原告新闻集团与OpenAI也有友好合作关系,他们并非希望你们不存在,只是他们不喜欢你们提供的合作方案?
Aravind
Srinivas
:
他们声称我们没有回应,这是不实的,我们当天就回应了。我希望大家能理解,我们意图是合作、参与、共同努力。
主持人:
具体是什么样的合作?比如说,如果你要与他们谈,你们会讨论哪些合作方案,比如分成,分成什么收入;怎么分成,这究竟是怎么运作的。
Aravind
Srinivas
:
我们推出 Perplexity出版商计划项目,几个月前上线,理念是内容授权是非常短期的合作模式。
一是将AI公司分两种类型:一种是利用网上所有数据来训练大型基础模型的公司,这些模型会内化所有文本、所有标记,以至完全掌握这些信息;如果模型训练完美,随规模扩大不断改进,所有内容都已经被内化到模型权重中。
第二种类型,是只在实时查询中使用网络内容作为来源,当来源相关时,对内容进行总结,甚至不会在其上进行任何训练,我们正在努力做到这一点。
我们试图向出版商解释,我们属于第二种类型,他们不应该抱有第一种类型公司会支付一定的费用,来获得我们内容授权,以训练模型这种心态,这是媒体与AI的合作模式。
对第二种类型公司,我们提出不同的作模式,目前没有人提出任何方案。
我们说法是,我们将通过广告来获取收入,我们根本上是一款搜索产品。我们直接提供答案,我们属于搜索类别,搜索类别面向大众消费者,最终可以通过广告获得大量收入。
与之前赚取大量广告收入,从未与任何出版商分享收益的搜索引擎巨头不同,我们承诺将基于查询级别,与出版商分享我们广告收入。
我们将通过广告获得大量收入,不会与出版商分享所有收入。
我们意思是,对某个特定查询,如果我们在这个查询中获得广告收入,你的来源被引用作为答案一部分,我们将与你分享这部分收入。
如果我们增长持续下去,我们能够有效通过广告将这种增长货币化,这将对所有选择与我们合作,允许内容被引用,作为我们答案一部分的出版商,带来巨大回报。
主持人:
这不是出版商的观点,比如,我们也是一家出版商,我们与你们没有任何协议。问题在于,我们认为,当有人在Perplexity的某个初创公司系统摘要中,看到我文章或其他内容被引用时,他们不会访问我文章,他们不会点击链接,剥夺我们生存所需流量与收入。
他们说,你们声称与我们不构成竞争,但你们就是竞争对手,就这么简单。你不同意这一点吗?我相信你一定不同意。
Aravind
Srinivas
:
你是怎么认为我们构成竞争的,我们不是新闻产品。没有人,真的是没有人会来Perplexity阅读他们每日新闻。
Aravind
Srinivas
:
人们来这里,是为了了解周围发生的事。
比如,有一条关于英伟达Blackwell GPU新闻,比如说是延迟,或者Jensen说一切都在正轨上。
你会问,这个新闻背景下,我是否应该继续购买更多英伟达股票?这些都不是你可以在TechCrunch上问的问题。
你可以来Perplexity问这些问题,你不会为了阅读Jensen所说的新闻内容,而来Perplexity,你会直接去来源网站,这是两种不同的产品,人们需要理解这一点。
我认为我们责任,是让人们更多了解这些差异,直观展示人们如何使用我们产品。
没有人会来这里说,请完整复制这篇文章给我,已经有其他网站可以做到这一点。网上有很多免费网站,你可以在那里粘贴网址,绕过任何付费墙获取内容,我们根本不是为了这个用例而设计。
主持人:
你们从更广泛互联网与所有创作者那里获得价值,数百万人在网上发布YouTube视频、文章、书籍、故事、各种内容。
我们该如何参与,我们已经习惯了,谷歌做广告,或者在YouTube上以这种方式获利,我们应该如何获利?
Aravind
Srinivas
:
我们之前没有参与其中,我们邀请所有人,绝对欢迎所有人加入我们出版商计划。
除了广告收入分成外,我们还将帮助你,为用户构建AI原生助手或任何类型AI助手,在你的平台上。
如果人们希望在你网站上专门搜索你的内容,比如他们正在阅读一篇文章,有一些后续问题,人们希望在文章上下文中提出,直接在你网站上,无需访问我们,我们将通过提供API,比如大量API积分来帮助你。
我们还将为任何媒体公司所有员工提供我们高级产品,我们Perplexity订阅产品企业版,我们认为我们产品可以帮助你更有效创建内容。
每当你撰写新内容或新闻稿件时,你都需进行事实核查,需要研究正在发生的事,或者参与该稿件的任何人,你都需要对他们进行调查研究。
现在,我们是最新潮研究工具之一,它将非常有助于人们更有效简化他们研究工作。
我认为我们在获取信息来源的一些方面,可能存在根本分歧,我的需求可能与你的需求不同等。
现在,假设他们暂时不在场,只有我们两个人。我们正在讨论这个世界,版权与诉讼之类的事,这是非常复杂、前所未有的知识产权法律领域,几乎没有先例,如果出现错误是可以理解的,你认为你可能在不知不觉中犯罪吗?这种情况会发生。我意思是,你认为有可能吗?
Aravind
Srinivas
:
我们已经发布了我们回应,类似我在博客文章中所说的,那就是我的立场。任何诉讼中,我们都会为自己辩护。
主持人:
你认为法律是否需要改变,允许更多类似事发生,比如公开知识产权,让知识产权更自由流通?
Aravind
Srinivas
:
关于版权已经有许多现行法律,已经有一些既定判例表明,对事实的版权并不存在。
Aravind
Srinivas
:
我们都不是律师,很明显,我们在这里无法解决这场争论。
Aravind
Srinivas
:
我们认为,事实需要普遍传播给所有人。
想象一下,如果过去科学家声称对某个事实拥有所有权,其他人不能陈述该事实,知识与真理就不能以这种方式传播。
主持人:
这是真的,这是一个很有趣的观点,我非常好奇。为什么要筹集这么多资金,免费提供事实很昂贵?
Aravind
Srinivas
:
AI很昂贵,我希望我们能够随时间推移降低成本。
目前,GPU 昂贵,数据中心昂贵,提供这些模型的人,需要通过收取推理成本收回部分投资。
我认为目前API成本,每4~5个月下降约 2 倍,这是最近的趋势。如果这一趋势,持续1年或2年,我们可以看到模型成本至少比现在降低10~ 50倍。
这对我们这样公司非常棒,我们在增长趋势中,成本却在下降。这样一来,就可以专注增长,短期内处理成本,你知道成本会下降,可以大幅度扩展你的运营。
我们认为,除了订阅外,还有很多其他方法可以将AI产品货币化。
订阅模式对许多公司说,都取得很大成功,我们在这方面做得相当不错。
我们认为,使用层面进行货币化,不仅是按月付费,有更好方法,我认为这取决于我们自己去探索。如果我们没有找到方法,筹集大量资金,我们会陷入困境,我们认为我们可以找到方法。
主持人:
你认为你们可以从谷歌那里分走一些广告收入吗?你认为人们会转向你们吗?
Aravind
Srinivas
:
某种意义上说,并非零和博弈,我不知道。
一种思考方式是,每个人都有特定的营销预算。如果我现在把所有钱都花在谷歌,将来我会花95%在谷歌,5%在Perplexity,我不知道它是否会那样运作。
已经形成的趋势是,Meta广告收入有所增长,谷歌广告收入也保持稳定,或者至少略有增长。如果我们广告收入增长,可能会损害其他公司广告收入。
我认为,每当出现新的平台时,首先要做的是不要疏远现有用户,不要失去他们信任,不要过度优化广告收入,毁掉它存在的原因。
还要设法让广告商相信,在该产品投放广告,没有品牌风险,以及如何处理幻觉。我们必须做很多工作,我认为至少需要2年时间,才能解决所有这些问题。
主持人:
知道了。我会说出一个公司名称,你告诉我,你是否收到他们收购、人才收购或其他任何形式的邀约,是或否。准备好了吗?OpenAI。
主持人:
说到移民,你今天早些时候在X/推特,说你正在处理自己的问题。我想给你一些时间,可以发泄一下,给正在经历同样问题的人一些建议。
你经营着价值数十亿美元的公司,还在努力获得绿卡,我认为这太疯狂了。
Aravind
Srinivas
:
我意思是,我的观点不是说我应该得到一切。
主持人:
每个人都会经历这个,这是一个艰难的过程,我希望你能说你的看法。
Aravind
Srinivas
:
我认为我对这个有合理的理解,美国移民系统中设定按国家/地区的配额上限,例如,对某个特定国家/地区,每年只允许这么多人获得永久居留权。
我认为疫情导致很多积压,这就是我认为进展缓慢的主要原因。
我们能做得更好吗?每个人都同意我的观点,该系统可以改进。我希望仅是抱怨,就能让人们更多关注这个问题,这是我的本意。
Perplexity
CEO
揭秘搜索内核:不训练模型、关键在于路由编排、比搜索引擎更敢说
Perplexity
AI CEO Aravind Srinivas接受Jim Rutt Show频道专访,
2024年10月18日公开发表。
Perplexity
AI 是基于 AI 的新型搜索引擎或答案引擎,优势在于能够提供更准确、更全面答案,擅长处理复杂或研究导向型的问题,提供来源引用。
这与传统搜索引擎,例如谷歌与大型语言模型例如OpenAI、Gemini形成对比,后者速度更快,处理复杂问题与提供观点方面表现较差。
Perplexity
AI 不回避给出观点,甚至在一些有争议问题上,也会呈现多种观点,附上来源。
Perplexity
AI 速度不如谷歌快,处理复杂问题上的优势,弥补速度上劣势。
用户使用谷歌与Perplexity
AI,根据问题的复杂程度,选择合适工具。
Perplexity
AI 使用 RAG检索增强生成技术,从网上检索信息,将其作为提示的一部分,提供给大型语言模型,生成答案,提供来源链接。这与仅依赖大型语言模型生成答案的其他引擎不同,使答案更可靠,更易进行事实核查。
Perplexity
AI 敢于表达观点,这与使用 RAG 技术、对准确性的不同取舍有关。
谷歌等巨头,为避免错误带来的负面影响,倾向给出含糊其辞答案,Perplexity AI 更愿意表达根据现有信息得出的观点,即使这可能会导致错误。
Perplexity
AI 利用大型科技公司在创新者困境,大型公司因害怕犯错而行动迟缓,为新兴公司提供机会。
Perplexity
AI 使用多种大型语言模型GPT、Claude、LLAMA、Mixtral 等,以及来自多个搜索引擎的排名信号,与第三方数据提供商的数据。它拥有自己索引,也会利用其他来源的数据,增强搜索结果。
Perplexity
AI 核心竞争力,在于独特的答案生成与数据整合能力,技术架构涉及多个步骤的检索、排名与答案生成过程,包括关键词匹配、n-gram 重叠、基于嵌入的相似性评分,大型语言模型的最终处理。
Perplexity
AI 使用向量数据库,如 Quadrant,进行嵌入式内容处理,提高检索精度。
Perplexity
AI 商业模式,包括付费订阅服务Pro 版本与未来广告收入,企业级服务搜索公司内部数据。
主持人表达对广告模式担忧,强调提供无广告付费版本的必要性。
创业公司比大型公司,更易保持hustle努力工作状态,能够更快适应变化与创新。
大型公司规模庞大,流程复杂,行动迟缓,难以快速响应市场变化。
Jim
Rutt
:
今天嘉宾是Aravind Srinivas,是Perplexity AI联合创始人、CEO,Perplexity AI 是AI初创公司,开发AI 驱动的搜索引擎,或者有人称为答案引擎。
Aravind是印度理工学院IIT毕业生,这所非常著名的印度科技学院,培养大量优秀人才。
他拥有加州大学伯克利分校计算机科学博士学位,共同创立Perplexity AI 之前,他是加州大学伯克利分校教授。
大学里,Aravind曾作为研究科学家,在 OpenAI 工作,参与 DALL-E 等文本转图像生成器项目,欢迎。
Aravind
Srinivas
:
非常感谢邀请我来到这里,非常高兴来到这里。
Jim
Rutt
:
我很高兴邀请你,我必须承认,我是Perplexity粉丝。
经常收听节目的听众知道,我每3集至少会提到它1次,我每天都在使用它。
它可能取代我50%~60%的Google搜索,以及相当一部分我使用ChatGPT、Claude作为答案引擎的使用。
我一直在扩展我的使用,这很有趣,主要是在蚕食我Google搜索。
我要说的是,对正在考虑切换的人,答案类型不同,在许多方面更好,在其他方面有所不同。
与Google相比的小缺点是速度,Google更快。
我总是在脑子里做优化问题,当我考虑使用哪一个时,我总是在浏览器中打开这两个。
如果它相对简单,速度更快,我会选择 Google。
如果需要花费时间筛选链接,试图弄清楚哪些是垃圾邮件,哪些不是,我会选择 Perplexity。
随着问题难度增加,我更有可能选择 Perplexity,我仍然发现Google更好、更快。
我今天下午又测试了一下,确保情况仍然如此,比如匹兹堡劳伦斯维尔最好的墨西哥餐馆,Google 在几个方面都更好。
另一方面,对很多事,Perplexity 绝对是答案。
任何我认为是研究导向的事,我将列举我在过去3天做的一些搜索,这能说明我使用它的类型,这些绝不是我做的全部搜索。
滑稽的是,我最后一次在Perplexity上搜索是,你对Perplexity CEO Aravon
Srinivas 有什么了解,它给了我最好的答案。
比如这样的问题:告诉我,过去1年,AI成本如何下降,或者,飓风米尔顿什么时候会袭击佛罗里达州以及在哪里,或者比较过去5 ~10年伯克希尔·哈撒韦与标普500股票回报,或者Google每年查询次数是多少,或者如何下载特定的软件,如何在我的Mac商店修复这个特定的软件安装,甚至像印度的国球是什么,或者副总统辩论什么时候举行,或者还有总统辩论吗?
这些问题,Google永远不会给你合适的答案,Perplexity会直接给出答案。
Jim
Rutt
:
他们太糟糕了,他们应该能解决这个问题。
Aravind
Srinivas
:
你知道为什么吗?他们害怕犯错。
一个错误,会让他们在品牌、声誉、股价方面付出巨大代价。
错误也会让Perplexity付出代价,我们对我们技术非常有信心,如果能帮助我们改进,最终做到正确,我们不介意犯错。
我们会非常透明告知用户,我们仍然是家正在努力解决问题的初创公司。
谷歌,他们是巨头,是行业中庞然大物。他们认为,谷歌推出任何东西,都应该是一流、准确、可靠。
早些时候,他们在谷歌Bard,现被称为Gemini,现场演示中就遇到问题。很多人可能不记得,那次现场演示失败,导致谷歌股价一天内下跌5%~7%。
我们利用的就是这种不对称性,这种创新者的困境:我们能正确回答80%查询,就能给像吉姆你这样的人留下深刻印象;谷歌回答错误20%的查询,就会让人觉得谷歌正在衰落,股价下跌,华尔街恐慌,谷歌不再被视为AI领域领导者,这就是像我们这样新进入者获得机会的地方。
Jim
Rutt
:
很有意思。对抗巨头,快速机动总是很有趣。
我非常喜欢Perplexity,不是谷歌、OpenAI、Gemini或其他任何公司的原因是,Perplexity引擎敢于表达观点。
OpenAI给出非常模棱两可的答案,左说右说,含糊不清;Gemini也是类似回答。
Perplexity直接回答:披头士乐队,给出原因,条理清晰,太棒了。如果我问一个关于哪个更好的具体问题,我想要一个明确的观点。
我问Perplexity,特朗普是否有精神疾病,它列举了认为他患有精神疾病人的观点。
我问OpenAI同一个问题,它给出完全平淡无奇的答案,回避这个问题。
我以前见过这种情况,Perplexity敢于表达自己看法,它不像其他引擎,总要将答案包裹在各种模棱两可措辞中,这是设计使然,还是一种偶然的结果?
Aravind
Srinivas
:
如果你设计一个系统,总是搜索网络,阅读其他人说法,根据这些说法形成观点,将得到性质完全不同答案。
这与仅试图回答AI模型构建者让你做的事,AI模型仅根据你问的问题,生成它自己观点,是不同的。
AI模型内置一些防护措施,或者使用不同类型的人类偏好强化学习RLHF技术,不同的AI模型,往往会以非常不同方式回答问题,有时甚至给出模棱两可答案,这就是它们被训练的方式。
Perplexity会告诉你,网络这部分认为是这样,那部分认为是那样,最终你必须自己得出结论。它提供的是关于不同事不同视角,是真正的视角,不是毫无意义的冗余信息。
之所以成为可能,是我们使用检索增强生成RAG的技术构建系统,我们从网上提取结果,将其作为提示的一部分,要求模型思考:使用所有这些作为额外的上下文,而不仅是基于你作为AI模型自己的想法,你能尝试回答用户问题,引用来源,确保用户甚至可以检查你所说的内容?这给Perplexity带来与ChatGPT相比,截然不同的体验。
我必须说,很多时候,引用的来源,是某种平淡无奇的评论文章,你可以从那里找到真正的来源,拥有这些引用非常非常有用,OpenAI目前没有引用。
直接从大型语言模型中提取引用非常困难,使用RAG简单得多。你知道RAG提取了什么内容,你可以浏览这些内容,从中挑选出想要作为来源的内容。
我认为这也是一个很大区别,尤其是在我进行更严肃研究时。你我都知道,正如你所说,十次有八次,现在我觉得应该说十次有九次,你可以得到不错的答案,并非每次都是完美的,你总是需要检查答案。
为了确保准确性,拥有引用,使得进行二次检查变得容易,如果你要将它用于任何重要的事,这都是必要的。
让我再给你举两个例子,说明我喜欢Perplexity的原因。
前几天,我为准备播客做了一个研究,很技术性的问题:五大人格特质模型(心理学中最常用个性理论,用五个维度概括主要人格特质)中,各类别间的双向相关性是什么?我在谷歌尝试了一下,结果一团糟。
我把这问题给Perplexity,直接给出正确的答案,完美。
另一例子是,我是业余爱好者,买卖与修理70年代、80年代复古音响系统,例如扬声器与放大器。
我经常会遇到一些关于非常古老,有时非常模糊的设备的问题。我今天刚买了一套90年代初复古扬声器,我想知道它们有多大。
谷歌给出信息含糊不清,我问Perplexity,它直接给我答案。
Aravind
Srinivas
:
没错,我一直在问这些问题。
比如,我在这个特别的活动上做演讲,这些就是他们问我的一些问题。
去看看我已经做过的所有采访,试着告诉我,应该如何回答这些问题,用一种我以前从未说过的方式。
它在这方面做得相当好,好到我几乎感觉自己可以被取代。
然后告诉我关于英伟达Blackwell芯片的事,最近需求激增,我该如何看待这只股票?
旧金山最近经历整个热浪,直到今天才降温。我试图弄明白那里为什么会发生热浪,它很好解释了高压系统而形成的整个热穹顶是如何形成的,它阻止了来自底部的所有凉爽微风。
这太神奇了,谷歌创建谷歌助手,以便你可以尝试问这些问题,他们从未真正实现过提供那种体验。
AI的拐点,出现在2022年底,随ChatGPT出现,AI模型开始能够进行良好总结、良好格式化,能够在聊天线程中,跨多个问题,跟踪上下文的能力。
所有这些能力,都可以用来构建全新体验。搜索是所有软件类别中最大的一类,我们想,为什么不尝试将它们用于搜索,最终就成了Perplexity。
Jim
Rutt
:
人们一直说谷歌很脆弱,他们没有大的护城河。
我最大,不是最大,我第二大投资失误是,我几个朋友获得参与谷歌IPO股票机会,他们问我是否想参与其中。我说,不了。20倍,50倍。
我论点是搜索没有护城河,我以前编写过搜索引擎,我知道这项技术不深奥。我忽略的是,看到所有的搜索,实际上是谷歌拥有的护城河。他们总是容易受到容量量子飞跃的影响。我认为AI搜索前端,至少有很大可能性从谷歌夺走可观的市场份额,除非他们做出回应。目前为止,他们完全软弱无力,唯一比他们更糟糕的是微软。
奇怪的是,起初,他们用于Bing的AI聊天前端还可以。我今天尝试Copilot,它完全糟透了,糟糕透顶。
Aravind
Srinivas
:
你提到努力,努力通常与初创公司、而不是大公司联系在一起。
我记得去雷德蒙德拜访Bing团队,那是在我们旅程早期。
我想他们刚推出Bing聊天,他们说,这是他们过去10年中最努力的一次。
那时我知道,如果一切都是关于这样努力,长期保持努力,对初创公司,比对大公司更容易,你根本没有这种实力。
比如,你能努力工作一两个月,你能坚持5年?这是个问题,激励措施也不存在。
对初创公司,它是你唯一产品,你不断改进它,不断获得新用户,不断看到指标上升,不断思考。
我们盈利模式、新模式、新商业模式,一切都令人兴奋,一切都是新的,一切都在增长,你感受到肾上腺素,这能帮助你努力工作数年,而不是1~2个月。这就是让你在产品优势与用户体验方面,优于大公司的因素。
Jim
Rutt
:
绝对的,我在这条线的两边都待过。
我曾在跨国公司担任C级高管,担任过上市公司CEO。我还做过5家初创公司,为17家初创公司提供过咨询,我完全明白你的意思。
大公司竟然能够生存下来,真是令人惊讶。这仅是它的规模经济,它人均实际生产力远低于初创公司,这非常重要。
这很好引出我下一个问题,我一直在深入研究,或者至少是在寻找人们对Perplexity评价,这可能不属实,就是你们在利用世界上现有东西方面非常聪明,而不是重新发明一切。
你能不能谈谈你们是如何决定使用哪些来自世界的东西,哪些东西要自己构建的,这对初创公司始终是关键问题。
Aravind
Srinivas
:
是的。我想法是,获得用户,这是最重要的事。
任何为了重新发明已经存在的东西,而延迟获得用户的事,都违背你的使命,违背公司业务。
搜索没有护城河,我认为只有一个护城河,就是品牌与分销。技术、延迟、运营规模、基础设施、吸引高质量员工、广告收入,所有这些都是其中的一部分,但一切都服务于分销。
当你是初创公司,无关紧要,没有人知道你时,即使你有一个完全自己构建的很酷演示,为什么有人会在乎。
我们在这方面一直都很务实,即使我们在AI研究方面,有相当不错背景,我们也从未真正觉得必须训练自己的模型,或者必须自己构建整个索引,这一切都是为了向用户展示全新的体验。
公司究竟在构建什么,核心产品体验是什么,这种体验将成为人们搜索的下一代方式的论点是什么,你如何验证这一点,这是你唯一的工作。
在你验证这一点之后,获得一定数量用户之后,找到一种合理获利的方式之后,尝试开始自己构建一些东西,利用每天收集的所有数据,尝试看是否有某种独特模型或独特编排、独特索引或排名,可以用来改进你的产品。这就是我们采取的方法,它对我们非常有效。
Jim
Rutt
:
这是我在网上读到的内容,包括Perplexity提供给我的内容。
听起来你们使用各种大型语言模型,我看到你们提到GPT、Claude、LLAMA、Mixtral。我看到你们使用Bing与谷歌,作为你们索引引擎。
你们还使用了哪些其他外部主要组件,这些信息准确吗?
Aravind
Srinivas
:
我们使用来自多个搜索提供商大量排名信号,我们构建自己索引,也依赖大量数据提供商的排名信号。
对某些我们不自行抓取或爬取的网络域名,我们依赖第三方数据提供商,这些提供商只提供高层级的摘要片段、与URL相关的元数据,不是实际内容。
我们使用许多开源的大型语言模型LLM,我们会对这些模型进行二次训练,以适应我们产品,意味着使其在摘要、格式化、简洁性、引用、上下文理解、长文本处理等方面,表现更好。
对闭源LLM,我们直接使用模型,在其基础上进行一些自定义后期训练,利用我们数据进行训练,进行大量提示工程。
我们构建路由器与编排系统,用于处理所有这些数据源、模型、特定许可证数据、第三方数据提供商、排名信号的API。所有东西,都会进入巨大的编排路由器,生成最终的使用者结果。
Jim
Rutt
:
这很有趣。我喜欢这类业务,本质上讲,你的回报取决于你组合各个部分的技巧,识别哪些部分可以改进,或者市场没有提供的哪些小部件。
跟我详细说说,你们是如何进行编排,在选择使用哪些数据源、如何加权、如何优先排序、如何处理这些数据源时,需要做出一些动态决策,谈谈这个编排引擎。
检索阶段本身,有很多事要做,取决于用户查询,你试图挑选出最相关的10个或20个不同链接。即使这样,也包含多个排名阶段。首先是基于查询词匹配,类似传统检索,例如TF-IDF风格检索,它会经过n-gram重叠作为第二阶段。
它会经过基于嵌入的相似性比较,这更具语义性与细粒度,它会考虑查询的上下文含义、文档的上下文含义。
它会挑选出许多链接中大约10~20个不同的段落,作为回答用户查询最相关的段落。
所有这些段落、对应的URL,都会进入LLM,LLM会在用户查询的上下文中决定如何将所有这些不同来源组合在一起。
我们可以根据用户意图,编写简洁或详细答案,这些答案格式良好、易于阅读,可以很好引用检索到的每个段落。
我们会收集大量数据,例如哪些域名与子域名值得引用,例如人们对这些域名信任程度,就是某种页面排名的概念,这也会用于影响排名。
最终的答案,会呈现为它在产品中的呈现方式。我们收集大量关于用户对答案反馈的数据,我们会调试如果答案AI模型本身出错而损坏,数据源本身没有问题;或者AI模型没有真正出错,是数据源质量差,或者索引不够新,数据源本身没有问题;或者有两个或三个不同的数据源,关于同一件事提供不同信息,AI模型不够聪明,无法判断哪些域名与子域名好坏。
现在,作为检索过程的一部分,你们是否使用语义向量数据库,来对内容片段进行嵌入,用于检索增强生成RAG?
Aravind
Srinivas
:
我们使用开源项目Quadrant作为向量数据库,在此基础上,进行一些自定义修改,向量数据库是容易被误解的。
排名过程,有三或四个阶段,传统的Elastic风格的关键字匹配与n-gram重叠,所有这些基于TF-IDF的排名,都能为你完成大部分繁重工作。你已经得到非常好的、高召回率的文档集,精度较低,但召回率相当不错。
基于向量嵌入的相似性得分,向量数据库的相似性得分,会进一步优化精度。
LLM
最终会最大程度优化精度,它在决定使用哪些来源来撰写答案方面,非常细致。可以这样理解,搜索就是确保你的结果,具有高召回率、高精度。召回率,意味着正确的文档包含在你检索到的文档集中,不一定排在最前面;精度,意味着正确的文档排在最前面。
即使在前两、三个链接中,包含你想要的内容;对有十个蓝色链接的搜索引擎,你真的需要准确把握位置,否则体验会非常糟糕。
对基于LLM的答案引擎,传统检索方式只需优化召回率即可。不是为了精度,合理的精度就足够。LLM会接收最终10个或20个段落,它可以比基于用户点击日志的训练,更好去除无关段落,这是相对谷歌构建传统系统的主要优势。
主持人
Jim
Rutt:
还有OpenAI运行的传统系统,他们只是LLM,上面还有一些其他的东西。
Aravind
Srinivas
:
不多,没错,他们构建了AI。他们绝对是让AI成为非常好的对话者先驱。
Jim
Rutt
:
这是我一个心头之痛。越来越多人在谈论AI时,指的是LLM或生成式AI,AI是比深度学习、LLM大得多的领域。
我们现在谈论的不是一般AI,而是基于Transformer的生成式AI,目前所有的动作,都在这里发生,这可能不是永远如此。
你们管它们叫大型语言模型LLM,大型语言模型类似一件精巧的东西。我感觉是,怎么说,你所谓的AI,可能最纯粹的理解,是将其视为能够行动的智能体,例如游戏引擎中AI,游戏里的一部分,比如你在制作吃豆人游戏时编写的AI,那些幽灵,或者当你尝试制作国际象棋游戏时,你要编写软件来模拟象棋,你必须为对手创建一个AI,传统上计算机科学家就是这样看待AI。
这就是为什么AI许多里程碑,都围绕着:我能否训练一个AI成为国际象棋或围棋游戏中最优秀的人类玩家,过去就是这样,还有雅达利游戏。
现在,AI似乎是指任何能自动化某种人类活动的东西,算是普遍的定义。某种程度上,将大型语言模型称为AI,并非完全错误,你可以认为大型语言模型能够帮你完成很多繁重工作,例如翻译人员、会议记录员、将会议记录重新整理成可操作的项目供与会者使用的人员、语法校正员、演讲稿撰写者等,所有这些基本任务,都可以通过大型语言模型实现自动化。
我认为,某种程度上,这可以算作AI,我明白你想表达的意思。
这是一个让人抓狂的问题,说它是大型语言模型,也没什么问题。
Jim
Rutt
:
这也是我的一个痛点,我长期为AI公司提供咨询服务,特别是面向AGI的公司。
我相信大型语言模型将是解决方案的一部分,它解决了大量问题,甚至在4年前,我们还认为解决这些问题需要10年时间,特别是语言问题。
还有其他问题,例如大型语言模型在数学方面很糟糕,是有原因的,它们永远不可能独立擅长数学,其他类型系统擅长数学,它们可以来回协作,利用大型语言模型找出应该解决的数学问题,使用求解器AI来实际解决这些数学问题,这个问题以后再讨论。
2023年我写了一个程序,它使用大型语言模型编写电影剧本。它有40个不同的地方需要人为干预,人类只需要花30秒或1分钟时间进行干预,大型语言模型就会自行运行。大约8小时人工时间,就可以写出90分钟的剧情片,太酷了。
如果没有大型语言模型,这不可能实现,看起来像是魔法,它仍然不是完整的AGI,不是具有与人类同等能力的系统,它很可能成为该系统的重要组成部分。
我本来想提一下我用Perplexity做的另一件事。我想这很有趣,也许是非法的,我认为它并不违法。无论如何,它可能很危险。孩子们,不要在家尝试这个。
我长期以来都有个投资想法,相当复杂的想法,类似小型对冲基金。我尽可能精确向Perplexity描述它,然后说,选择投资来执行这个策略,它做到了,这些投资方案非常合理,我将对其进行测试。
我将组建小型对冲基金,投入5万美元左右,测试这个策略,看看会发生什么。如果它有效,这是一个高度对冲策略,它不可能在一个方向上走得太远。如果它有效,我将继续运行它。我将每月运行一次该查询,根据Perplexity建议调整投资组合中权重。
基于Perplexity比任何人都更了解现在正在发生的事,它似乎完全能理解相当复杂的策略,毫不畏惧。
我敢肯定,如果我问OpenAI,它会说,我不能提供投资建议,我不是注册的投资顾问等。
Perplexity,完全愿意制定正确执行该策略的模型投资组合。
Aravind
Srinivas
:
Perplexity不是你财务顾问,它是非常棒的财务研究工具。
我鼓励大家不要盲目听信别人投资建议,要自己研究所有这些股票。
现在,你只需要Perplexity查询,就可以了解。
我应该投资英伟达吗?我不太明白。所有信息,都已被计入价格了?黑色世界芯片延误会怎样?对训练GPU的需求如何?英伟达现在竞争对手是谁?它仍然没有竞争对手?5年后市场会怎样?这将如何影响亚马逊AWS收入?英伟达利润率是如何被挤压的?谁可能会这么做?
所有这些,都是我试图了解我没有接触过、或没有这方面专家指导的领域的方式,这太神奇了。
你能收集到的知识量,只需几次Perplexity查询,就能收集到大量知识,这真是令人难以置信。
这就是该产品构建方式的原因,任何人都可以提出任何问题,不用担心受到评判,我觉得现在是一种非常不可思议的超能力。
Jim
Rutt
:
让我告诉你一件,你可能可以改进的事,我一直都在使用它,为我思考其他事提供有用的摘要。
如果思考是分块的,能够更快、更好获得这些预处理的块非常重要,而不是阅读一本500页的书。
例如,前几天,在一场在线辩论中,我需要比以前更好理解黑格尔辩证法,这是19世纪德国浪漫主义时期的哲学思想。
今天,我重新运行查询,Perplexity做得相当不错,ChatGPT 4.0做得更好,BingCopilot完全不行。
我使用相同查询,ChatGPT做得更好地方在于,它提供更多细节,即使提示是提供黑格尔辩证法的详细解释。
在我的例子中,至少ChatGPT更接近理解我所说的详细意思。
你对此有什么想法?你意思是,Perplexity答案,在某些方面能提供更多细节?能够从Perplexity中获得比现在更多细节。
OpenAI提供的信息密度,大约是Perplexity的两倍。
Aravind
Srinivas
:
你是在手机APP、还是在网页上进行查询?
Aravind
Srinivas
:
我觉得,我又试了一下你的东西。对我说,它看起来已经很详细了。我想,区别可能在于我们可能正在进行任何特定的A/B测试,试图看看有些人是否更喜欢简洁的答案或详细的答案。
如果你的提示包含详细,没有理由不为你提供详细答案。有时我们会倾向不在移动APP输出过多文本,人们屏幕空间有限,注意力跨度也有限。
Jim
Rutt
:
我几乎不使用移动APP,我讨厌移动应用。
Jim
Rutt
:
应用程序,类似帝国反击真正的互联网一样。旅行时,我不得不使用它们,它们在某些方面也很方便,比如Uber。
当我坐在那里看书时,有时我会在手机上使用Perplexity。
你们有API吗?如果你们有API,我就会开始把它集成到我一些小型PC工具中,那将非常酷。
我很想听听你对如何解决这个问题的看法,搜索的护城河似乎相对较低。
我没有在Google
IPO时投资时,错过了什么,那就是看到所有查询,他们现在看到85%的查询,这本身就是一个可持续的竞争优势。不是一个巨大的优势,也不是零。你认为Perplexity未来,会有什么样的护城河?
Aravind
Srinivas
:
我认为仅是能够处理如此多不同类型查询、每个查询如此多不同的自定义UI、学习如何将其中很大一部分货币化,潜在的使用规模下保持用户体验,这将非常非常困难与具有挑战性。为此所需的基础设施、需要考虑的正确性、速度、可读性、协调如此多的不同工具与数据源,这将非常困难,我可以完全预见成百上千的事可能会出错。
仅处理不断变化的AI模型能力、准确性、延迟的动态空间,这将非常具有挑战性。
我觉得,如果我们克服这个挑战,本身就是我们护城河。由此积累的市场份额,将会非常巨大。
Jim
Rutt
:
你们将拥有先发优势。如果你突破成为每个人在想要比谷歌更好的搜索时想到的东西,你将拥有在人们的应用程序页面上的心智份额与空间。
该死的应用程序,讨厌应用程序。但这成为一种护城河,本质上是一种渠道护城河,其中渠道受到限制。
人们只能想到这么多搜索引擎,如果你在心智份额中排名前三,就拥有一些非常重要的东西。
我想深入探讨一下,那就是货币化。我最近在一个账户上看到广告了?你们正在测试广告、还是投放广告?
Aravind
Srinivas
:
我们还没有投放广告,我们打算投放广告。
Jim
Rutt
:
我认为一些引用被包装起来,看起来有点像广告。
我想再发表一下我著名的鲁迪观点:我讨厌该死的广告。
我认为这是互联网的毁灭,大约在2002年,摩尔定律使得网络与计算足够便宜,你可以仅靠广告来资助相当大的网站,那是互联网的毁灭。
我知道你们需要一种货币化模式,我真诚请求你们,始终提供无广告的付费层,没有什么比广告更让我讨厌的。
Jim
Rutt
:
免费产品,你们必须以某种方式将其货币化,你们应该让人们有机会维护他们的认知主权。
我最近在格鲁吉亚共与国的佐治亚州动物园村庄,发表一个关于这件事的演讲,对认为自己是创造性思考者的人说,最重要的事之一,是保持你的认知主权,以免他人劫持你的大脑。
我们今天世界的一切,都想要劫持你的大脑,几乎纯粹形式的劫持大脑就是广告。你认为你们货币化组合中,还会有哪些其他内容?
Aravind
Srinivas
:
企业级服务,例如允许你搜索公司内部文件与数据,而不仅是外部数据,我认为以前从未做过,构建用于网络、类似十个蓝色链接的搜索引擎、与构建用于内部使用的搜索引擎完全不同,人们永远无法在一个地方构建两者。
大型语言模型,允许你以一种非常简洁的方式统一它们,大部分繁重工作,都是由大型语言模型完成。我认为我们可以此构建下一代知识工作平台,用于研究等。
它拥有巨大市场,数亿人在世界各地每天都在工作,他们都将成为此类产品日常活跃用户,我认为潜在市场规模非常巨大,这对我们是清晰的货币化机会。
我们还将做更多API方面工作,例如允许人们构建针对特定垂直领域的Perplexity之类东西,或者他们真正关心的事。
例如,互联网是否存在你真正想要结果的某些领域?你为此付出努力去选择它,依赖Perplexity或添加功能来构建很酷的聊天体验。
我们想成为许多硬件设备的一部分,我们会支持正在构建新硬件设备的人,通过我们软件,为他们提供良好的语音到语音功能。
这些是目前的计划,我们非常灵活,可以继续在这里进行实验。
Jim
Rutt
:
你认为专业版的高级价格应该定多少?这又是我个人的不满,我知道这匹马早就跑远,但如果人们愿意为真正的东西支付少量费用,而不是被广告攻击,世界将会变得更好。不幸的是,心理上说,人们更喜欢免费东西。你们看到专业版产品的使用率,有多高?
Aravind
Srinivas
:
完全同意,现在已经有数十万用户付费。
Jim
Rutt
:
我希望这个数字增加,我认为这比基于广告模式向公司发送不同激励信号。
基于广告模式下,你们最终会像Facebook一样,完全腐败,他们唯一指标是能让你多久把眼睛粘在屏幕上。
Perplexity这样产品,最大优势是让我比Google快4倍完成搜索,不必重复搜索,不必过滤掉搜索中出现的很多搜索垃圾信息等。
某种程度上,广告可能是对Perplexity这类公司的一种腐败吸引力,在你们前进的过程中,请记住这一点。
Aravind
Srinivas
:
完全同意,完全同意。
Jim
Rutt
:
谈谈你需要成功,还需要什么。
这可能不是最新的信息,这是Perplexity说的,你们最近一轮融资是在4月进行的,估值约为10亿美元?你们筹集了6,200万美元左右,似乎不足以对抗谷歌。
Aravind
Srinivas
:
在此之前,我们进行过其他几轮融资。
比如,在此之前,我们进行B轮融资,融资金额7,000万美元。
在那之前,我们进行种子轮融资,融资金额100~200万美元。
我们的融资轮次,不止这一轮,我们肯定有相当多的资金。
谷歌有1,000亿美元流动资金躺在银行里,他们每年利润还在增长。
我认为关键在于确保公司健康发展,拥有大量用户,获得良好营收增长。
确保我们知道如何利用筹集到的资金,将其转化为正确增长与指标,这是我们现在真正关注的重点。
Jim
Rutt
:
听起来不错,我看了一下你们的投资者名单,非常意外的是,名单上主要是个人投资者,不是机构投资者。
我一直认为创业融资,是我强项之一,我一直对这个领域非常感兴趣。
我从比尔·所罗门那了解到这个领域,他长期担任哈佛商学院创业融资的首席教授。
非常幸运的是,我把他请到我第一家公司董事会,他给我进行了私人创业融资辅导。
你是如何选择让你主要投资者,是个人,而不是机构的?
Aravind
Srinivas
:
我们融资轮次一直由机构牵头,比如确定价格锚定融资轮次的牵头投资者一直是机构。
例如,A轮融资由NEA完成,B轮融资由IVP完成,C轮融资由Daniel Gross牵头,他也是一种机构投资者,他所配置的资本数量很大。
不是完全由个人投资者主导,个人投资者也一直是我们融资轮次重要组成部分,与机构投资者并存。
例如,英伟达是我们投资者,他们是机构;贝索斯是我们投资者,他是个人,贝索斯的钱太多了。
Aravind
Srinivas
:
没错。关键在于他们能为我们公司带来什么价值,他们声誉,他们能为我们带来的介绍机会,他们能提供的战略建议与合作。
Jim
Rutt
:
现在,IVP,是Insight Venture Partners,还是其他IVP机构风险投资公司,我不认识他们。
通常,Insight会在稍晚轮次进行投资。你们下一轮融资,他们是一家非常优秀的公司。NEA也是一家非常棒的公司。
我对Perplexity有一个抱怨,非常烦人,难以置信,毫无疑问很容易解决。
至少每隔一天,当我打开Perplexity窗口,我的浏览器上到处都是这些窗口时,我都会仔细输入提示词,按回车键,什么也没有发生,它吞噬提示词。
过去2个月里,这种情况至少发生在我身上25次,肯定有什么问题,不应该出现这样的用户体验。昨天发生这种情况,我确定它仍然存在。
另一方面,OpenAI偶尔出错,说你必须重新登录,它永远不会让你输入提示词,然后吞噬它,而不做任何事。
Perplexity会这样做,并非总是如此,经常发生,很规律。
我会把这个带有项目符号的笔记发给你团队,说:该死的,把它修好,它真的很烦人。
它发生在网页版上,我只在网页版上见过,它经常发生,就在昨天还发生了。
我尝试使用你们图像生成器,它看起来简直是垃圾,我可能没理解它。
暂时不要相信这个,如果我花足够时间弄清楚如何使用它,它仍然不令人愉快,我会把我的想法告诉你。
Aravind
Srinivas
:
我没有在任何地方看到这个谣言,你在哪里看到的?
Jim
Rutt
:
Perplexity里搜一下,看看谁在谈论英伟达收购Perplexity?你可能会得到一些结果,我在X/Twitter上看到过这个传闻。
Aravind
Srinivas
:
我可以确认这是假的,我们投资者黄仁勋在使用Perplexity,我认为很多英伟达员工都是Perplexity每日活跃用户。
我们在框架软件如TensorRT、LLM推理方面,有很多合作。我们使用他们Nemotron框架进行训练,并没有实际收购谈判。
Jim
Rutt
:
戴上我战略家帽子,这对英伟达说,是个愚蠢的主意。
英伟达是一家基础设施与平台公司,总是很诱人偷偷进入某个市场,这却是一个糟糕的战略决策。
你对Perplexity未来1~年有什么展望?未来2年,你的计划是什么?
Aravind
Srinivas
:继续发展,保持产品卓越,保持速度,保持准确性,将用例扩展到简单问答、事实核查与知识相关研究之外,扩展到许多不同垂直领域,让人们能够在这里完成许多日常活动,甚至在Perplexity进行本地交易,使产品更加个性化,几乎成为他们第二个大脑。
如果我们把这些基本的事,都做好,将这些转化为良好商业企业价值,我们将非常成功,这是我唯一关注的重点。
Jim
Rutt
:
在你们这个阶段,这听起来很合理。最终,你将不得不玩更高层次战略游戏。
如果你在未来2年,都能出色执行,这可能就是你真正需要做的全部事。
我会告诉你,它在哪些方面有用,只是为了好玩,我尝试用它解决一个编码问题。
它并非为此而设计,但我使用Claude或GPT的新001预览版进行编码非常棒。
我尝试Perplexity,它做得出乎意料不错。我知道它并非为此而设计,但要让它成为一个不错的编码助手,可能不需太多工作。
Aravind
Srinivas
:
是的,很多人使用Perplexity编写代码。我认为它的优点,在于非常擅长搜索网上文档页面,尝试提供考虑了最新开发者库与更新等的代码,模型本身并非总是最新的。
有些人更喜欢用它来调试与特定库相关的特定问题,或者弄清楚如何精确连接两个依赖项。我认为人们正是为了这些与编码相关的疑问,而使用Perplexity。
我觉得编码市场是二分的,很多人喜欢在编辑器VS Code、GitHub Copilot 上原生使用AI。有些人使用ChatGPT,它现在已经成为肌肉记忆,这是ChatGPT首次成功解决的重大用例,占据先机。
有些人喜欢云端,你可以构建一个代码生成的工件,可视化代码,以及它的前端。
有些人喜欢Perplexity,它可以访问文档与库,有些人更喜欢这种方式。
我觉得编码领域没有一家独大的赢家,人们会根据当时具体用例选择不同工具。
Jim
Rutt
:
非常好。我要感谢你进行这次极其有趣的对话。
我对某些方面有一些小异议,我还是要对所有听众说,请使用Perplexity,它很棒。
如果你使用了,不会后悔。你可以从我这儿拿回你的钱,我真的认为Perplexity是我在过去1年中,看到的任何类别中,产品能力提升最惊人的产品。
我知道你们在此之前已经存在,我可能只是在6~8个月前,才开始使用它,我只是觉得它太棒了,你们做得非常出色。
解决掉那个提示吞噬问题,在我看来,你们将拥有一个A+的产品,非常感谢。
科技说:马斯克、贝索斯、拉里·佩奇/谢尔盖·布林、扎克伯格、黄仁勋、Vitalik Buterin、Brian Armstorng、Jack Dorsey、孙正义、华为、马化腾、张小龙、张一鸣、王兴等
投资说:巴菲特、芒格、Baillie Giffrod、霍华德·马克斯、彼得·蒂尔、马克·安德森、凯瑟琳·伍德等
元宇宙说:Meta/Facebk、苹果、微软、英伟达、迪士尼、腾讯、字节跳动、EpicGames、Roblox、哔哩哔哩/B站等
星际说:中国国家航天局、NASA、历年国际宇航大会,SpaceX、Starlink、蓝色起源、维珍银河等
消费说:亚马逊、沃尔玛、阿里、京东、拼多多、美团、东方甄选等
每个系列聚焦各领域全球顶尖高手、产业领军人物,搜集整理他们的致股东信、公开演讲/交流、媒体采访等一手信息,一起学习经典,汲取思想养分,做时间的朋友,做长期主义者。
六合年度报告全库会员,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
智能时代专题,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
智能时代专题第二季,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
智能时代专题第一季,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
六合商业研选付费专题报告,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
元宇宙专题,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
头号玩家第二季,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
头号玩家第一季,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
智能电动汽车专题,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
【智能时代】现象级游戏《黑神话:悟空》的思考,游戏二元属性,文化与科技
【智能时代】自动驾驶:汽车iPhone时刻,中国三大流派演化形成中
诸神之战:美国科技巨头,从春秋五霸进入战国七雄|GBAT 2023 大湾区智能时代产业峰会
人类未来文明三部曲之二:智能时代专题预售开启,奇点临近,未来已来
九宇资本赵宇杰:智能时代思考,
认知思维,存在原生、降维、升维三波认知红利
九宇资本赵宇杰:智能时代思考,以史为鉴,科技浪潮,从互联网到AI
九宇资本赵宇杰:智能时代思考,宇宙视角,从碳基生物,到硅基智能体
人类未来文明三部曲之一:元宇宙专题预售开启,59期45万字
九宇资本赵宇杰:1.5万字头号玩家年度思考集,科技创新,无尽前沿
九宇资本赵宇杰:1.5万字智能电动汽车年度思考集,软件定义,重塑一切
【重磅】前沿周报:拥抱科技,洞见未来,70期合集打包送上
【重磅】六合年度报告全库会员正式上线,5年多研究成果系统性交付
【智能电动汽车专题预售】百年汽车产业加速变革,智能电动汽车时代大幕开启
【头号玩家第一季预售】:科技巨头探索未来,头号玩家梯队式崛起
【头号玩家第二季预售】:科技创新带来范式转换,拓展无尽新边疆
【首份付费报告+年度会员】直播电商14万字深度报告:万亿级GMV风口下,巨头混战与合纵连横
【重磅】科技体育系列报告合集上线,“科技+体育”深度融合,全方位变革体育运动
【重磅】365家明星公司,近600篇报告,六合君4年多研究成果全景呈现
九宇资本赵宇杰:CES见闻录,开个脑洞,超级科技巨头将接管一切
【万字长文】九宇资本赵宇杰:5G开启新周期,进入在线世界的大航海时代|GBAT 2019 大湾区5G峰会
九宇资本赵宇杰:抓住电子烟这一巨大的趋势红利,抓住产业变革中的变与不变
【IPO观察】第一季:中芯国际、寒武纪、思摩尔、泡泡玛特、安克创新等11家深度研报合集
【IPO观察】第二季:理想、小鹏、贝壳、蚂蚁、Snowflake、Palantir等12家公司深度研报合集
【IPO观察】第三季:Coinbase、Roblox、快手、雾芯科技等12家公司深度研报合集
【重磅】年度观察2019系列合集:历时3个多月,超20万字近500页,复盘过去,展望未来,洞悉变与不变
【珍藏版】六合宝典:300家明星公司全景扫描,历时3年,210万字超5,000页,重磅推荐
九宇资本赵宇杰:对智能电动汽车产业的碎片化思考
九宇资本赵宇杰:九宫格分析法,语数外教育培训领域的道与术
【2023回乡见闻录】90、00后小伙伴们万字记录,生活回归正轨,春节年味更浓
【2022回乡见闻录】20位90、00后2万字,4国13地,全方位展现国内外疫情防疫、春节氛围、发展现状差异
【2021回乡见闻录】22位90后2万字,就地过年与返乡过年碰撞,展现真实、立体、变革的中国
【2020回乡见闻录】20位90后2万字,特殊的春节,时代的集体记忆
【重磅】22位“90后”2万字回乡见闻录,讲述他们眼中的中国县城、乡镇、农村
六合君3周岁生日,TOP 60篇经典研报重磅推荐
下午茶,互联网世界的三国杀
5G助推AR开启新产业周期,AR眼镜开启专用AR终端时代
新商业基础设施持续丰富完善,赋能新品牌、新模式、新产品崛起,打造新型多元生活方式
【重磅】中国新经济龙头,赴港赴美上市报告合辑20篇
知识服务+付费+音频,开启内容生产新的产业级机遇,知识经济10年千亿级市场规模可期
从APP Store畅销榜4年更替,看内容付费崛起
新三板破万思考:新三板日交易量10年100倍?
九宇资本赵宇杰:科技改变消费,让生活更美好|2017 GNEC 新经济新消费峰会
九宇资本赵宇杰:创业时代的时间法则,开发用户平行时间|2016 GNEC 新经济新智能峰会
九宇资本赵宇杰:互联网引领新经济,内容创业连接新生态
|2016 GNEC 新经济新营销峰会