专栏名称: 十字路口Crossing
AI 正在给各行各业带来改变,我们在「十字路口」关注变革与机会,寻找、访谈和凝聚 AI 时代的「积极行动者」,和他们一起,探索和拥抱,新变化,新的可能性。「十字路口」是乔布斯形容苹果公司站在科技与人文的十字路口,伟大的产品往往诞生在这里。
目录
相关文章推荐
爱可可-爱生活  ·  【[134星]LangFair:一个Pyth ... ·  22 小时前  
机器之心  ·  字节版Operator抢跑OpenAI? ... ·  23 小时前  
爱可可-爱生活  ·  【[2.2k星]Blinko:一个开源、自托 ... ·  昨天  
爱可可-爱生活  ·  【[72星]vLLM Production ... ·  2 天前  
爱可可-爱生活  ·  晚安~ #晚安# -20250123224524 ·  3 天前  
51好读  ›  专栏  ›  十字路口Crossing

2024 年度复盘 AI 出海:梦想、勇气、一年赚到千万美金 | 对谈线性资本郑灿、LinkLoud 高宁

十字路口Crossing  · 公众号  · AI  · 2025-01-24 20:33

主要观点总结

本周的「十字路口」节目讨论了AI创投领域的一个热门话题:AI创业者的「出海」战略。节目中介绍了多个年收入超过1000万美金的AI公司,并探讨了这些公司成功的关键因素。同时,两位嘉宾分享了他们对2024年的洞察,并对2025年的AI应用领域进行了展望。他们强调了AI在改变各行各业中的潜力,并预测了多模态交互和AI原生硬件等未来的发展机遇。

关键观点总结

关键观点1: AI创业者的「出海」战略

节目中探讨了AI创业者为何选择出海,以及他们看到了哪些机会和可能性。

关键观点2: 成功的AI公司案例

节目中介绍了多个年收入超过1000万美金的AI公司,并分析了它们成功的关键因素。

关键观点3: 2024年的洞察

两位嘉宾分享了他们对2024年的独特洞察,强调了AI在改变各行各业中的潜力。

关键观点4: 2025年的展望

他们预测了多模态交互和AI原生硬件等未来的发展机遇,并探讨了这些趋势对AI应用领域的影响。


正文

本周的「十字路口」,农历新年前的最后压轴一期,我们打算聊一聊 AI 创投领域人人都关心的问题:「出海」。




2024 年,越来越多 AI 创业者把目光投向海外市场,出现了一大批年收入超过 1000 万美金的出海公司和产品,我们将在本周的节目中一一盘点和介绍:Plaud、Monica、Opus Clip、HeyGen、Notta、Hix 等等。

出海势不可挡,我最近见到的 AI 创业者,不夸张的说,10 位里面有 5 位都告诉我他们选择了出海做全球市场,剩下 5 位虽然还在做国内,但也都蠢蠢欲动,在积极思考、储备资源、以及积攒出海的勇气。

所以本周的「十字路口」,我们聊一聊 AI 领域的创业者们为什么要出海?他们看到了哪些我们没看到的机会和可能性?那些已经迅速从 0 到 1 ,实现了超过 1000 万美金年收入的 AI 公司,做对了哪些事情?我们要如何学习、模仿、复制他们的成功经验呢?



👬🏻 本周我们邀请到两位嘉宾:

  • 线性资本董事总经理郑灿:线性在 2024 年投资了 11 个 AI 项目,活跃投资,一年下来郑灿估计聊了至少上百个 AI 创业团队,在一线感知着水温。

  • Linkloud 联合创始人高宁:他这两年陪伴了超过百位出海企业家前往美国和日本,对创业者的思维变化和市场趋势有着独特洞察。大概半年前,高宁在「十字路口」和我们聊过一期《那些你不知道的 AI 产品,正在海外闷声赚大钱》,介绍了近 20 个优秀的出海 AI 产品,今天我们也会和高宁一起继续分享,在最近半年又出现了哪些在海外闷声赚大钱的新产品?


微信收听播客:

小宇宙收听播客:

2024 年的关键词:解锁与发现

🚥 Koji

欢迎二位!请二位分别用一个关键词来形容一下自己的 2024?


👦🏻 高宁

谢谢 Koji 的介绍。今天很开心能跟灿总还有 Koji 一起录半年后的第二期节目。

如果用一个字来形容 2024 年的话,我选择了「解锁」(unlock)。今年算是自己创业和做这个社区的第二年。选择「解锁」是因为我们在新的地方,包括湾区、东京开始做我们自己的沙龙,认识了很多本地的创业者。第二个原因是真的有机会看到从 2023 年跟我们一起出海的公司,到 2024 年开始有一些实质性的进展和落地,尤其是在日本市场。我们也有幸陪伴了这个从 0 到 1 的过程。


🚥 Koji

郑灿的 2024 一个关键词是什么?


👦🏼 郑灿

谢谢 Koji。我觉得我的 2024 可以用「发现」来形容。因为我们主要在线性投 AI 应用,整个 AI 应用领域现在还处在很早期的阶段。

常常有一种感觉是我们站在一个新时代的开始,就好像站在一个非常空旷且每天都在变得更大的平原上,我们在寻找新出现的物种。

这种感觉坦白讲在过去很长时间里是很少有的。有一句话叫「风起于青萍之末」,我觉得大概就是这个意思。


🚥 Koji 这个比喻非常形象,站在一个空旷且每天都变得更大的平原之上,寻找哪里有新的生命在孕育。



Plaud 与 Notta:两个千万美金级 AI 产品的成长

🚥 Koji

前面我们提到了几个年收入超过 1000 万美金的案例,还有哪些出海 AI 产品值得和大家介绍?要不要高宁先来说几个。


👦🏻 高宁

我来说一个可能大家已经听过的,就是许高做的 PLAUD.AI[1]。这是一款适配于 iPhone 的、帮助大家在通话中录音的 AI 硬件,它会在通话结束后发送摘要。

它现在甚至不只是年收入超过 1000 万美金,在朋友圈我们也提到它已经达到月收入 1000 万美金。这是一个从增长角度和产品定义角度都非常典型、很有代表性的 AI 产品。它很好地借助了 TikTok 这样的新兴渠道,找到了一个看起来不怎么起眼的场景。这让我想到上一期雨森谈到的观点:找到一个看起来不太起眼的人群或需求,但实际上是被大家低估的需求,然后迅速打开市场。


🚥 Koji

其实看到 Plaud 的时候,很多人会认为他做的东西没有什么特别之处,就是电话录音然后用 AI 转文字记录下来,这听起来是一个很简单的想法。他很可能面临着非常激烈的竞争,甚至来自华强北的超低价竞争。

因为你和他交流应该比较多,我有两个好奇:一个是他怎么在那样的竞争里面做到第一名的?第二是他现在怎么思考即将面临的这种山呼海啸般的山寨竞争?


👦🏻 高宁

我先回答第二个问题,硬件只是一个切入口,真正要延展的是在数字世界

当你把这些来自物理世界的语音、音频变成文字之后,要思考能给不同画像的用户提供什么样的价值。

他提到因为 AI 软件的这个展示部分,是通过订阅制实现的。从去年下半年开始,一些职业人士,比如律师、牙医、现场施工工人、保险销售等,实际上会把它当成一个在工作中非常有效的产品,他们都很愿意去订阅和续费。

回到第一点,我觉得许高应该是我看到的在 GPT 出来之后,最快抓住这个能力并找到机会,做出最好产品结合的案例之一。因为从时间维度来说,他一定是最早推出这个产品的。这样的用户群和用户心智,如果第一个做的人做得好,就能占据很大优势。从后续的关键词搜索、视频播放量等数据来看,他一直都保持着很大的长尾优势。


🚥 Koji

那也问一下郑灿,你看到的那些年收入超过 1000 万美金的出海 AI 产品中,有哪些让你感到特别值得一提、眼前一亮的案例?


👦🏼 郑灿

我们投过一家企业叫做 Notta[2],可能大家或多或少都听说过,他们主要是做会议智能的 AI 助手。

很大程度上是因为这一轮的 AI 让他们要做的事情变成可能。与其他公司不太一样的是,他们从日本市场开始做。我们看着他们从在日本一个月赚几千美金,发展到现在整个年收入已经超过 1000 万美金。他们现在在日本的 C 端用户群体中占到超过 75% 的份额。在日本开始做之后,他们从 To C 转向 To B,另一方面也开始做全球化,从日本向海外拓展。现在大概有 25% 的收入来自日本以外的市场,其中约 20% 来自美国。这些可能大家还不太了解。


🚥 Koji

其实做会议的转录也是一个非常红海的地方。那 Notta 是怎么做到今天这样的成绩的?


👦🏼 郑灿

我觉得有两个重要的点。第一个最关键的是,日本是一个很特别的市场。日本市场天然有一个屏障,使得很多竞争对手一开始就被 block,而且是自愿停留在这个屏障之外。第二个是日本本土的竞争相对偏弱,整个环境是一个供不应求的状态。所以他们在日本通过正规军的打法做 SEO,就能够比较顺利地成长起来。


🚥 Koji

他在日本做 SEO 也是做 google 吗?然后用日文的这个本地的团队吗?还是用会日语的中国人去做 SEO?


👦🏼 郑灿

最开始的时候,用会日语的中国人就可以了,当然找到在中国的日本留学生也都可以。因为在做 To C 的时候,其实没有必要去到日本。但当你开始要走 To B 的路径时,就需要有日本的办公室,需要有日本的一号位,这是一个战斗的升级。


🚥 Koji

其实我们刚才还聊到另外一个年收入超过 1000 万美金的 AI 产品叫 Hix[3]。这是一个比较低调的公司,所以可能大家日常不太讨论。Hix 现在有一个产品群,包含好几十个产品。刚才我很惊讶地听到郑灿提到,Hix 目前的状态只有创始人彪哥才能做得到。

那能否请郑灿给大家介绍一下彪哥到底是何方神圣,为什么他能做得这么厉害?


👦🏼 郑灿

我觉得彪哥最厉害的是在过去的经历中,形成了一套非常完整的流量运营方法,从选品到运营流量都有独到之处。

很多时候同样的一件事情,在会运营的人手里和在不会运营的人手里,在流量效果上可能会有千倍级的差距。我觉得彪哥就是整个 Hix 的灵魂人物。


🚥 Koji

我很好奇二位这一年会觉得自己回头看的话,做了哪些值得分享的事儿?

之前我在即刻上打趣高宁,说他是中国的 2024 年的郑和。因为他带着创业者出海,像当代郑和一样。


👦🏻 高宁

第一件事,我觉得在这个上下半年我们做得比较完整,每隔半年分别去一趟硅谷和日本。我们看到不管是初创公司的创始人,还是更多的上市公司或准上市公司的创始人,都会亲自带队,带着高管去实地考察。我看到了硅谷这边所谓的 founder mode,也 就是创始人亲自驱动的精神非常明显,这是跟前两三年相比变化很大的一点。

第二个事情是我们在继续落地的过程中,2023 年做了第一期关于 SEO 的 workshop。今年在大家继续发展和继续关注的话题之上,新增了两个板块:一个是关于 PMF,一个是关于 social marketing。

海外的推广方式跟国内有很大不同,这不仅仅是渠道的不同,而是你要理解当地市场的用户在思考什么,在关心什么,这是一个思维模式的转变。

最后一件事是让我觉得挺开心的,就是在日本做了第一场面向华人的沙龙。


🚥 Koji

郑灿,我现在非常好奇,线性公司这一年应该是最活跃的美元基金之一,投了 11 个项目。可不可以分享一下你们主要投资的方向?如果方便透露的话,也可以介绍一下投资的具体公司和产品。


👦🏼 郑灿

我们今年在 AI 这个方向上总共投了 11 个项目。在年初的时候我们也启动了一个项目叫做「Linear Bolt」主要是为了帮助新一批全球化 AI 创业者。在 AI 发展的早期阶段,对我们和创业者来说都充满机遇。我们希望能有一些新的变化,以更轻快的方式提供帮助。

这 11 个投资项目主要面向全球市场,大部分是 To Consumer 和 To Professional 方向。绝大部分企业总部设在中国。主要投资方向包括:教育、陪伴、生产力工具、科技消费品。这些也是我们会持续关注的方向。从根本上讲,我们对投资方向并没有太多限制,但确实有这样的倾向,这更多是由 AI 落地的先后顺序所导致的变化。


🚥 Koji

对,线性是投了 11 个 AI 项目,那整个线性投了多少个项目?


👦🏼 郑灿

整个线性投了 17 个。


🚥 Koji

所以投的 A I 占比还是非常高的。

然后刚才我还看到另外一个有趣的细节,是你说大部分都是面向全球市场的 AI 公司,这个是多大部分?


👦🏼 郑灿

应该除了一个之外,全是上来就面向全球市场。


🚥 Koji

我想这个和早几年投资的版图应该是发生了翻天覆地的变化的,不会有那么高比例的出海。这个是你们刻意为之,还是不知不觉就投出了这样一个分布来?


👦🏼 郑灿 其实我们对这个问题做了蛮长时间的思考,最主要的原因,我认为还是中国的工程师红利中国的工程师红利应该转向一个更大的市场。基于这个想法,我们开始走全球化的路线。


🚥 Koji

在这一年二位的工作看上去都是绝大多数时间都在关注 AI 的出海,有没有什么让你们印象非常深刻的故事?


👦🏻 高宁

我在东京参加了由 WaytoAGI[4]Comfy UI[5] 的华人组织者,以及一些大模型 AI 创业者共同举办的第二届全球峰会。

令我意外的是,他们不仅邀请了 ComfyUI 的创始人,还邀请了许多视频 AI 大模型的训练师,以及非常厉害的创作者、设计师和爱好者齐聚东京。大家完成了整整一天近 20 场的交流。这是由中国人发起的一个全球性活动,对我的冲击非常大。

接下来我再分享第二件事。我在湾区接触到一位做 AI 医疗领域的华人创业者,他在做 AI 医院信息化和自动化服务。虽然这是一件特别繁重的工作,但确实能帮助特定门诊部的护士或后勤人员释放大量产能,让他们能够投入到真正对患者、对医院有价值的事情上。

作为华人,在做 SaaS 或传统领域创业时,我问他是否担心会遇到很多挑战和融入障碍。他给了我一个很感动的回答。他说自己是 PhD 出身,本来没想过要做 AI + SaaS 创业。但让他印象最深刻的是,像 Notion[6]Airtable[7]ComfyUI[8] 这样的成功产品,其实背后都有华人创始人。这些创始人都在前期花了很多时间打磨产品、了解用户,经过多次调整才最终成功。他们的成功不仅鼓舞了他,也让 VC 更有信心投资华人创业者做 SaaS 或进入壁垒较高的领域。因此他也很希望未来能有机会分享自己的经验,为社区做出贡献。


🚥 Koji

所以你看到了两点:一个是创业者的勇气,一个是创业前辈为新一代创业者们树立的榜样和带来的力量。

其实我们在前几期「十字路口」有一期复盘美元基金的节目里,花了很长篇幅讲美元基金,讲美国的美元基金现在非常积极地在投华人团队。我们当时做了一些统计,比如 a16z 的 Speed run 孵化器[9]就投了七八个华人团队。他们甚至招募了中国背景的投资人加入团队,不是 abc 背景,而是在中国读本科的背景。这在他们的历史上是很少见的招聘。我觉得这背后释放出的信号,是对这一批新的华人创业者在开拓海外市场时寄予厚望。

郑灿,想请你分享一下在 2024 年有哪些和出海相关的印象深刻的故事或者人?


👦🏼 郑灿

我觉得也先分享两件事。第一件是我参加了 Linkloud [10]组织的日本之行。这可能是今年给我启发最大的一次出行,也是我第一次去日本进行类似商务考察的工作。

这次经历让我认识到日本是一个很特别的市场,它与中美都不太一样。我开始思考:

很多时候,当一件事情的第一个台阶很高时,人们会因为跨越这个台阶的困难而失去探索的兴趣和勇气。但其实这个台阶后面可能是机遇或者乐园。

这个发现对我而言印象特别深刻,也在一定程度上影响了我现在的一些工作。

另一件事是,我们在年初启动「Bolt」项目的同时,还开展了一些其他工作。我们开始比过去更认真的以内容为出发点经营自己的公众号,写文章。这样做的原因是我们觉得在当下这个时间点,所有人都在思考未来的方向和自己的定位,但没有标准答案,因为这个世界变化太快了。所以我们希望能从这些角度去帮助创业者,把我们的思考和看到的信息分享出来。我认为这在这个时代是非常重要的事情。

之前同事跟我说,在不同场合听到大家称赞我们的公众号写得很好。昨天正好碰到一个老朋友说:「你们今年开始做内容了,做得还不错。」这是我第一次听到这样的评价,感到特别自豪。

但我真正想说的是,我也特别鼓励所有正在思考的朋友们,能在这个时候把自己的想法分享出来。因为在这个所有人都渴望了解他人想法的世界里,分享的杠杆效应会特别大。


🚥 Koji

推荐大家关注线性资本的公众号。其实郑灿刚才提到线性今年非常积极,不只是投资积极,做内容也很积极。那在一线你有哪些体感?你今天看了多少个项目?


👦🏼 郑灿

我来之前统计了一下,我们在册的项目大概有一百多个。这里说的「在册」是指我们正式沟通后需要入库的项目。实际上因为大家知道我们比较开放,所以首次接触的项目会更多一些。我想分享几个比较明确的感受:

今年确实整体节奏变慢了,不需要去抢项目。这个现象的原因可能和大家想的「投资冷却」不太一样。我觉得是因为在所有事物都在飞速变化的当下,创始人在仔细思考,投资人也在仔细思考,只有双方的思考到达一个契合点,投资才会发生。这其实是一个更为正常的状态。当然,在这个变化的过程中,思考需要的时间会更长一些,不像以前大家长期处在一个固定状态,这些思考早就完成了,看到就可以直接投资。现在我觉得很多时候大家都需要仔细考虑。

另一个方面,我觉得现在整个创业的试错成本显著降低了。因为 AI 的原因,试错成本比以前低,试错速度也比以前快。某种程度上,我觉得大家都在期待创始团队能够展示一些让我们信服的东西。因为不需要花很长时间,至少从我们的角度看,很多东西都可以快速验证,这可能也是原因之一。

回过头来说,我觉得这才是正常的投资速度。整个市场至少从我的感受来说绝对不缺钱。只要创始人在他所处的阶段能交付好的结果,不管是 Pre-product,还是在 PMF 阶段,你在 Pre-product 时有特别的想法和原型,在 PMF 阶段有漂亮的数据,我觉得都不用担心融资的问题,这是我的感受。


🚥 Koji

高宁其实也是前投资人,现在可能和做投资人一样,每天还是和创业者泡在一起。你在这一年下来有些什么样的体感?


👦🏻 高宁

其实大家都发现,我们前面聊到的一些产品,包括 Plaud、Hix,都发展得挺不错。不管从用户还是收入的角度,都有很好的增长,但这些公司都没有融资(bootstrap)。我们今年确实见到越来越多这样的公司,并不是说他们从头到尾都不会融资,而是说他们不需要一开始就融资。

因为快速试错的市场成本真的变得很低,有些创业者可能就一两个人,或者一个小团队,就能快速在某些产品上进行验证。

他们成为了很好的独立开发者或小团队,也取得了一定的收入规模。在这种情况下,他们可以选择不融资。


新物种:在海外默默发展的创新产品

🚥 Koji

半年前高宁和我们录了一期节目,讲「那些在海外闷声发大财的出海公司」。那期节目播放量非常高,大家都想从中找到一些财富密码。

现在又过了半年,想请问高宁,你有没有发现一些新的在海外默默赚大钱的出海产品?


👦🏻 高宁

第一个有意思的发现是关于图像领域。我们去年上半年聊到了很多文身图相关的产品,包括 Cutout.pro、Fotor 等。这些项目在 Stable Diffusion 等开源图像模型出现后快速增长,是很有代表性的出海项目。回顾 2020 年至今,我发现这类公司已经从单纯的图片处理,发展成了多模态加视频的形式,从文身图到图片生图片,再到视频的这波红利,我认为还远远没有结束。像 OpenArt[11]Polyverse[12] 的产品都发展得很好。

这些产品在收入增长、人群细分、甚至国家区域拓展上都有了特别大的突破。比如针对健身人群、不同国家的修图人群、不同年龄段的用户,以及面向 SME (Small and Medium-sized Enterprises)中小企业的海报制作需求,甚至餐厅等特殊场景的开发,都让他们的收入获得了超出想象的提升。

第二个有趣的领域是宗教类应用。比如有一个华人开发的产品叫 Blessed,主打基督教应用,提供经文诵读和引导式祷告服务。它的效果并不仅仅体现在功能性上,更多是在心灵层面的提升。我了解到这个产品取得了很大的增长。另外,之前在我们沙龙分享过的 Xmind[13],这个非常成功的思维导图产品,在一年前推出了与佛教结合的产品。他们最近还开发了一款 AI 塔罗牌应用。他们分享说,主要是靠精美的色彩和人物设计,吸引了很多在审美上认同他们的付费用户。

还有一家相对成熟的公司测测[14],相信包括我在内很多人都用过他们的小程序。他们从早期的心理测试、性格特征测试、MBTI 起步,现在结合 AI 实现了更好的互动和解读效果,在这一两年获得了显著增长。

第三点,我认为未来一两年特别有机会的是 AI 原生硬件。在近期的 CES 上已经看到了很多富有想象力的产品,创始人或团队主要来自中国和日本。我更期待看到有更多从心理或情感陪伴角度出发,针对特定人群和国家推出的产品。


🚥 Koji

昨天其实王兴也罕见的发了一条朋友圈,他分享了一个 CES 上的产品,是一个很搞笑的产品。那个产品叫 Nékojita FuFu。

为什么叫 FuFu 呢?是因为它是趴在你的杯子上,FuFu 把沸腾的水或牛奶或咖啡帮你吹凉。


👦🏻 高宁

对,我可以补充一下,我看了一篇关于 CES 硬件的文章,给我留下最深刻印象的就是这个售价 25 美元的 FuFu。


🚥 Koji

我觉得他还是在销售一个快乐,销售一个故事。关于高宁刚才提到的一些在海外表现不错、收入可观的新产品,我试着总结了两个方面:

一方面是模型能力的提升,解锁了很多新的可能性,不管是文身图还是文身视频,不论开源还是闭源,这些新的进步带来了许多机遇。

另一方面,关于宗教与 AI 的关系,这很有趣。它不会标榜自己是 AI 产品,整个网站都看不到 AI 的字样。那么为什么 AI 能帮助宗教类产品突飞猛进呢?

我认为有两个原因:一方面是,宗教类产品需要大量内容,在过去这样的内容制作成本极高,而 AI 帮助解决了内容供给的问题;另一方面是,做这样的产品需要获客获得流量,AI 在这方面也帮了大忙,特别是在做 SEO 方面。

类似的产品,我观察到它们都符合两个特征:第一是 AI 可以高质量、高效率地生成内容;第二是 AI 可以帮助获取流量,既解决了供给端,又解决了流量端。像这样的创业机会其实还挺多的。

另外还有一个最近半年让我印象深刻的案例,虽然和 AI 没什么关系,是一个叫 StressWatch[15] 的 APP。因为 APP 的收入相对更透明,大家可以在 Sensor Tower[16] 上看到,Stress Watch 现在每月有 60 到 70 万美金的收入。这提醒我们,虽然我们经常讨论 AI,但在其他领域也不断有中国团队做出全世界认可且愿意付费的新产品。


👦🏻 高宁

当我们去年观察 APP 端的产品时,看到一些小团队的发展其实还不错。他们借鉴了一些已经在 Web 端被验证过的场景,发现在 APP 端同样存在相似的用户群体和机会。通过快速开发移动端应用,我相信这将是今年一个比较大的机会。


🚥 Koji

其实这一波我们提到的很多赚钱的公司都在 Web 端,这里面有一个流量红利的问题。虽然 Google 已经存在几十年了,但过去十几年移动互联网的发展,反而使得 PC 端的流量竞争弱于移动端。企业可以通过 SEO 非常高效地获得免费流量,这在移动时代,即便是此时此刻也是不可能的。在移动端要获得免费流量是很困难的。

这就是为什么这一波我们看到很多盈利的公司都在做 Web 端。而且因为 AI 天然具有提升生产力的属性,所以在 Web 端出现了一些新的机会。郑灿这里你有什么补充吗?


👦🏼 郑灿

因为我们主要关注 base 在中国的创业公司,所以发现目前在盈利的赛道上相对比较拥挤。我们看到比较成功的产品基本集中在几个大的赛道上,包括图片、视频,以及一些 AI 陪伴或聊天类产品。这些赛道规模都很大,但也确实都很拥挤。我们做得好很大程度上是因为在这些领域本来就研究得比较深入。

就像视频本来是中国的优势,因为有抖音所以有剪映,然后发展出各种视频 AI。我们也很期待在其他领域和市场看到类似的机会。这呼应了刚才讨论的几个推动力,比如新的模型带来的新机会或新的模型能力。

可以举个例子,很多之前就默默盈利的非 AI 领域,其实可以被 AI 改造,依然保持着稳定盈利的特点。今年大概是第一个 AI 说话像人的元年,如果我们把这项技术用到电话服务上,会发现海外有一个特别的领域:专门用电话帮你处理账单争议、退货等事务。这原本是你不愿意做,但之前有公司帮你外包处理的事情。现在通过 AI 就可以完成,我们看到有团队在做这样的尝试,他们在 Product Hunt 上的排名也很不错。

这是一个明确知道可以盈利的行业。这个项目叫 Pine,是一个原来声网的团队在做的产品。


🚥 Koji

这个很有意思。


👦🏻 高宁

类似 DoNotPay[17] 这个。


👦🏼 郑灿

对,类似 DoNotPay 和 Bill Shark[18] 这样的产品。我们期待看到这些本来就是成熟商业领域的项目,能够有人用 AI 去创新和改造。


Devin 与 Cursor 的差异化定位

🚥 Koji

最近你们还看到了哪些给到你们很多启发的产品?


👦🏼 郑灿

给我印象最深的是两个领域:Coding多模态。在 Coding 方面,我过去尝试了市面上大部分 AI 编程产品,我体感最好的是 Cursor。其中很有意思的一点是这些产品实际上是针对不同的目标群体和客户的。

这让我对产品力有了很深的感受。讨论产品力的强弱,其实就是把产品做到刚刚好的程度。在今天,因为 AI 承担了大部分的基础工作,所以团队真正需要做的是花很多时间进行研究,为用户提供恰到好处的控制,让产品在最少的交互下,输出正好符合需求的结果。听起来很魔幻,但今天的 AI 确实可以做到这一点。

比如说作为一个工程师,我在使用 Cursor 时需要一定程度的控制。我需要它按照我的想法工作,现在它基本上能在 80-90% 的情况下输出正好的结果,同时还给了我适度的控制空间。

相比之下,另一个产品叫 bolt.new,它是针对不会编程的用户的。我用起来就很不顺手,因为总是感觉「打不准」,要么往左偏一点,要么往右偏一点。但对它针对的目标用户来说,这可能就是一个恰到好处的产品。因为对他们而言,完全用自然语言交互,然后得到一个完整的结果,这个过程中不需要做任何技术性的工作。


🚥 Koji

对,这其实是非常微妙的。表面上看大家说到 Cursor 会把 bolt.new、Windsurf、Lovable 放在一起讨论,但真正使用后会发现,它们的目标用户群和设计理念是截然不同的,尤其是 Devin 与其他产品就更不相同。


👦🏼 郑灿

对,我花了 500 美金使用 Devin,但它给我的感觉是把我所有的快乐都剥夺走了,只留下不快乐。它把我的创造能力全部剥离,我告诉它的需求很简单,但它要花很长时间让我等待。最后给出一个结果,我还需要很认真地检查是否满足我的要求,然后继续与它交互。这个过程把所有的愉悦感都剥夺了,只把那些不愉快的部分留给了我。


🚥 Koji

是的,你说的快乐主要是指创造的快乐。在使用 Cursor 时,你其实还是在创造,基本上每半分钟到一分钟都会和它互动一次。而 Devin 就是你交给它一个任务,然后过几个小时回来检查一下结果。


👦🏼 郑灿

要过好久,半个小时起步,然后搞不好还真的是超过半个小时、一个小时。


🚥 Koji

我现在使用 Cursor 和 Devin,他们确实有非常不一样的用途,但我都找到了在不同场景下使用它们的感觉。

对于 Cursor,我会用它解决非常具体的问题。比如我前天刚写了一个简单的程序:每天早上十点定时检查我的 Gmail,看前一天是否有新的发票邮件。如果有的话,就把发票邮件里的附件或链接下载下来,然后存到我 Google Drive 指定的位置。这样每个月我就可以批量下载发给财务。这类具体的技术任务,虽然交给 Devin 也可能做得出来,但我倾向于不交给他处理。

那么什么任务适合交给 Devin 呢?研究型的任务。比如说我最近在思考一个项目:如果要开发第二个语言版本,应该选择什么样的语言?是进军西语市场、日语市场,还是德语市场、法语市场?这个任务我就交给了 Devin。他非常擅长把一个任务拆解成不同环节,就像找了一个麦肯锡咨询顾问,根据我的目标来设定整个严谨的思路。这个过程本身就很有启发性,我关注的不是 Devin 给出什么样的结果,而是他拆解任务的过程,让我发现原来可以这样去分解思考的过程。


👦🏼 郑灿

其实 Devin 真的不只是个工具,他更像是一个 agent——一个初级员工。在某些领域他的表现其实并不初级,还挺不错的。你只需要把任务交给他然后回来看就行。


从 Notebook LM 到多模态交互

🚥 Koji

我使用的 Devin 是在一个朋友购买的团队账号里,账号内有六七个人。由于团队成员之间可以互相看到使用情况,我发现大家交给他的编程任务几乎都没有成功,最终效果都不太理想。所以现在大家几乎都和我采取了相同的方式——主要把研究类任务交给他,这个现象很有意思。

Devin 是你提到的一个让人印象深刻、带来启发的产品,除此之外还有吗?


👦🏼 郑灿

刚才讲到多模态,另一个让我非常喜欢的是 Google 的产品 Notebook LM[19]。对不了解的朋友们简单介绍一下,它最早是一个帮助做研究的产品。我特别想讲的是它的 Audio Overview 功能,可以帮你把材料(无论是 PDF 还是其他格式)转换成几分钟的播客概述。

那么这个产品的创新点在哪里呢?虽然现在的 TTS 技术已经很成熟了,大家可能觉得这听起来是个简单的工作。但实际上,我尝试过很多种方式,也研究过很多种方法去复现,最终能够达到 Notebook LM 这个水平的却非常少。它在一些细节处理上非常出色,就像我们现在录播客聊天时,当听到高宁说的特别令人激动的内容,我就会 jump in;在对话过程中,因为 Koji 在积极倾听,会发出一些简短的回应声,比如「嗯」「是的」;说到激动处时语速会加快或放慢。这些细节其实用现有的其他技术手段都很难做到。


🚥 Koji

是的,差不多过了四个月,有非常多复刻的尝试,但没有一个能达到它六成的水平。这确实很有趣。我和 Ronghui 之前录过一期播客,专门讲述我们发现的 Notebook LM 十个有趣用法。

最近 Notebook LM 还发布了一个更有意思的新功能:你可以听两个人对话,同时随时插入提问,他们就会停下来回答。而且在回答问题之前,两个人还会互相交流一下,接对方的话,整个过程极其自然。我觉得这令人难以想象,这里面一定融入了大量非 AI 模型带来的创新,可能是产品经理和工程师对用户的深刻洞察,再结合工程化能力才达到的效果。

为了准备上一期节目,我们研究了他们背后的团队。有一个很有趣的发现:核心成员中有一位既不是工程师也不是产品经理,而是美国的一位非常有影响力的畅销书作家。他从始至终都参与这个项目,可能正是他的思维提供了一些难以捕捉的智慧。这些微妙的细节让 Notebook LM 做出来的产品比其他同类高出一个层次,到现在也没有人能够真正复刻出来。


👦🏼 郑灿

是的,你提到的那位作家在 Hard Fork 上有一期播客。另外,他们产品团队还在另一个播客节目 Training Data 也录了一期播客。这两个资源都很适合用来了解他们背后的思考方式和产品化思路。相比之下,我们看到的其他复刻尝试更多停留在技术层面和代码层面。


🚥 Koji

对,这个产品的产品经理和核心工程师现在已经出来创业了。看到这个消息时,我也有一个感慨:硅谷确实是一个自由的地方,没有竞业禁止这一说。你做出了优秀的产品,就可以非常迅速、自由地去做下一个自己想做的事情。相比之下,我们身边有非常多朋友要背负两年的竞业禁止,这真的很要命,我觉得非常扼杀创新。


👦🏼 郑灿

创新的结果确实没有经验可循。这是法律层面的差异——加州法律禁止竞业限制。


🚥 Koji

其实法律也是大家文化的和价值观的一个折射。


👦🏻 高宁

当然。


👦🏼 郑灿

尤其他们都是案子打出来的法律。


👦🏻 高宁

我想说两个产品,第一个已经成为我的日常工具——玉伯老师开发的 YouMind[20]

作为创作者,我对每篇想读的文章都有很高的敏感度,知道哪些内容对我有用。这里有两个要素:首先是我希望能快速保存文章片段,包括图片、视频,甚至视频中的精华内容。这就是所谓的 Save 功能,是构建我未来创作素材的重要起点。

第二个要素是:在阅读文章时的思考过程中,我可能会记录一些个人想法,也可能会借助 AI 来探讨一些我不太了解的技术领域。就像有人在旁边交流一样,我很喜欢用插件形式截取一段文字然后与 AI 对话。

另一个相对成熟的产品是我最喜欢的一款 AI Native 产品 Gamma[21],创始人是在美国土生土长的华裔。今年特别打动我的一个功能,除了 AI 生成 PowerPoint 和幻灯片之外,是它在 Prompt 这个领域的创新。我觉得它很好地解决了如何让用户不用写 Prompt 这个问题。

比如在制作幻灯片时需要大量配图,Gamma 现在的功能是:当你输入内容后,它会有一个优化器(Optimizer),自动把你的简单描述解析成实体描述和风格环境两个部分。这些都是基于用户最初的粗略 prompt 描述自动生成的。

我用过很多类似的生成图片产品,但让我意想不到的是,Gamma 虽然不是专门的图片生成工具,但它的效果很出色——通常不超过两次就能选到合适的配图。这就体现了真正的产品力:他们深知用户想要生成好的内容但不会写好的 Prompt,并在这方面下足了功夫。


机遇之地:日本市场的独特性

🚥 Koji

这听起来是一件比较简单的事情,但他们真的把它做到产品里,给用户带来了很好的体验。我们最近也在做一个 AI 写 blog 的项目。

为了让博客有很好的 SEO 效果,需要在文章中插入配图、表格和目录等元素。配图这块很有讲究,我要求每篇博客插入三张图,而且要求 AI 自己根据上下文选择在最有画面感的位置插图。然后再根据上下文来写 Prompt,调用 Recraft 的 API。现在已经完成了几百篇,每一篇看上去都很赏心悦目。

前面我们在聊出海的时候,你们两位都不止一次提到日本,这似乎是你们今年一整年下来印象非常深刻的关键词。你们在日本市场看到了什么样的机会,或者看到了什么样让你们如此兴奋的可能性呢?


👦🏼 郑灿

日本最大的特点是它是个供不应求的市场。究其原因,主要是日本本身的 IT 能力较弱,AI 这方面的实力也不强。

但整个数字化需求,尤其在过去的两三年里,开始变得极其强烈。这里面蕴含着很多机会,而且市场并没有供给。

我认为还有一个重要原因,就是日本市场的进入门槛,其第一个台阶特别高。这使得很多创业者和企业在考虑时可能会自动将其过滤掉,从而造就了这个独特的供不应求的市场局面。


👦🏻 高宁

日本的市场门槛相对较高,主要是因为他们比较保守,不太愿意轻易做出改变

但有个有趣的现象:一旦你进入市场后,如果能给用户带来革命性的产品或全新的优质体验,并且展示出你在日本市场本地化和坚定发展的决心,让人认可你是在为他们提供服务,那么他们对你的接受程度会直线上升。

从另一个角度来看,日本的资本环境也相对友好。如果企业要寻求上市或退出,一方面有规模较大的财团或 CVC 可以作为并购对象;另一方面,对于收入门槛来说也比较灵活。如果你的收入达到几千万美金,就有相应的平台可以上市。当收入达到大几千万美金或几亿人民币时,还会有不同的上市渠道可供选择。值得注意的是,今年一些较大的、与软件或科技相关的 IPO 项目中,不少都来自华人或大中华区的团队。


👦🏼 郑灿

说到资本环境,日本除了退出友好、上市门槛低之外,还有一个有趣的特点:

日本的早期投资相对较弱。

无论是总体资金量还是帮助程度,都比中国和美国小一些。从这个角度来看,中国创业者进入日本市场反而可能具有一定的竞争优势。


🚥 Koji

所以中国的这个创业团队去日本不只有工程师红利,还有资金红利。是的,所以是这个双重 buff。


👦🏻 高宁

如果要举例说明创业机会,有一点特别有趣:即便是现在基础的语言模型和翻译功能,在日本市场上我们仍然很难找到一个能将日语优质转换为中文或英文的产品。这一点确实令人意外。

虽然市面上有不少翻译产品,但实时翻译讲究的是对上下文的快速理解。因为理解了下文后,往往需要重新调整前面已翻译的内容。而日语本身又有很多独特表达和倒装结构,这种语言特点在实时翻译中就产生了大量本地化的机会。


2025 展望:确定与不确定的未来

🚥 Koji

而且今天聊下来,二位提供了非常多的资讯,也提供了非常多的洞察。

我自己其实也很好奇,就是二位作为投资人,也作为创业者你们是怎么保持对行业这样的敏锐度的?有哪些特别的信息的来源或者方法可以和大家分享?


👦🏻 高宁

去年我主要通过两个渠道获取信息:一个是订阅的 Newsletter,另一个是 Podcasts。这两个平台都能在网页端提供沉浸式的阅读体验。有了 Youmind 之后,我也能更好地收集和整理各种信息。

我最近关注较多的是一些备受认可的投资人所写的 Newsletter,包括 Boldstart Ventures 的创始人 ed.sim 写的周报,以及知名的 Altimeter 的投资人 Jamin balls 写的 SaaS 周报等。

至于 Podcast,内容就更丰富了。我会关注关于 AI、软件和科技领域的播客,今年特别关注一些与行业领袖的一对一深度访谈。去年我们看到很多创始人开始参与播客节目,比如 Cursor、Devin、Anthropic、Notebook LM 等团队都上过播客。我认为从这些一对一的深度访谈中,能获取到很多有价值的信息。


👦🏼 郑灿

和刚才提到的一样,我也看很多 Newsletter 和 Podcasts,但我可能比较特别的是热衷于动手实践。通过实际做东西,我能更直观地了解各种可能性,也清楚什么东西能做,能做到什么程度。


🚥 Koji

那你最近做的一个有趣的东西是什么?可以分享一下吗?


👦🏼 郑灿

我最近尝试重新做了 Notebook LM。更早之前有个有趣的经历:在 4o 发布前的那个周末,我做了一个本地的「文字到语言大模型」系统。这个系统可以将说话转成文字,经过模型处理后再通过 TTS 转换出声音。

当时我写了一篇内部文章,指出只有在本地运行并保持极低延迟的情况下,才能实现类似打断对话这样的自然交互体验。我们认为这个方向一定大有可为,结果一周之后 4o 就发布了。


🚥 Koji

是的,现在团队也提供了 API,而且成本降得很低。


👦🏼 郑灿

是的,这也是为什么这个领域吸引我的原因。我认为明年乃至未来,整个多模态领域,特别是声音模态会有很多创新出现,因为技术已经打开了这扇门。


🚥 Koji

最后一个问题,请展望一下 2025 年:在 AI 应用领域,哪些事情你们认为一定会发生?哪些事情虽然还不确定,但你们很期待它发生?


👦🏻 高宁

我先说说我的看法,也很期待被打脸。我认为比较确定的是,我希望能有一个 Personal Agent,它能主动关注我所关注的内容,让我随时能与它交流。它的职能会从单纯的工作效率助理,逐渐发展成能在生活中提供陪伴和情感价值的助手。

就像雨森曾经提到的,是否能从一个单纯的「笔友」—— 你给它内容让它修改,转变成像 Devin 一样,能自主思考和行动,只在遇到不懂的问题时才来询问你。后者是我更期待看到的发展方向。

谈到模型能力,无论是搜索还是推理能力、影响力等方面都有提升。大家看到更多的是在科学领域的突破,比如物理、数学等方面。但我比较担心的是,在情感、陪伴和性格特征等方面,目前看到的学术进展并不多。坦率地说,现在任何产品离真正的智能对话还相当遥远。我不确定这是工程能力的问题,还是需要更多研究和能力提升。不过这或许也是一个很好的创业机会点。


🚥 Koji

郑灿呢?你对 2025 年的期待有哪些?确定的、不确定的有哪些?


👦🏼 郑灿

确定的是,刚才讲过,我很确定多模态,尤其是语音模态会有更确定的落地。

所谓更确定的落地就是能够商业化,而且可能会有各种各样的载体,包括软件和硬件,我觉得这是其中一个方向。当然这不仅仅是声音这个模态,可能还会有别的模态,这些端到端的模型会打开新的可能性。

相对不确定的,其实是非常不确定的一件事情是,到现在为止,我们看到的所有的 AI 机会几乎都还是产品型的或者工具型的。但实际上是不是会有新的平台型的机会出来,因为那样的机会每一个都很大。另外一个不确定的是中国的创业者能在这个当中扮演什么样的角色?


🚥 Koji

对,我觉得最后这个观点挺有意思。就是我们看到的都是工具型的,包括我们今天讨论的全部都是工具型的,那有平台型的机会出现,这个很值得思考关注。

好,我们今天先聊到这儿,谢谢二位的时间。

我们也欢迎大家关注「十字路口」。我们每过一段时间就会和大家一起来盘点一下那些在海外闷声发大财的 AI 出海产品和公司,希望给大家更多的灵感与启发。祝大家新年快乐,过个好年🧧


👦🏻 高宁&郑灿

新年快乐 🧧🧧🧧





欢迎订阅「十字路口」播客

🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚 AI 时代的「积极行动者」,和他们一起,探索和拥抱新变化,新的可能性。


👦🏻  主播 Koji:新世相/躺岛的联合创始人。我相信科技尤其是 AI 会在未来彻底改变社会,赋能人类,欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻[22]Koji 的网站[23]


👧🏻 主播 Ronghui:供职于科技 VC,前《第一财经周刊》驻硅谷记者,Ronghui 的即刻[24]


欢迎加入「十字路口」的会员群

☀️ 第一手的 AI 资讯与洞察

👫🏻 鼓励大家谈恋爱/交朋友/寻找未来的同路人

🦀 添加小助理微信入群:Rwkfbcianvd ,或扫下方二维码

参考资料

[1]

PLAUD.AI: http://plaud.ai/

[2]

Notta: https://www.notta.ai/en

[3]

Hix: https://hix.ai/

[4]

WaytoAGI: https://waytoagi.feishu.cn/wiki/QPe5w5g7UisbEkkow8XcDmOpn8e

[5]

Comfy UI: https://www.comfy.org/

[6]

Notion: https://www.notion.com/zh-cn?g-exp=g-exp--marketing_contact_sales_cta--v1&g-exp=g-exp--marketing_home_page_assistant_header--v3

[7]

Airtable: https://www.airtable.com/

[8]

ComfyUI: https://github.com/comfyanonymous/ComfyUI

[9]

a16z 的 Speed run 孵化器: https://a16z.com/games/speedrun/

[10]

Linkloud : https://www.linkloud.com/

[11]

OpenArt: https://openart.ai/

[12]

Polyverse: https://www.polyversestudio.com/

[13]

Xmind: https://xmind.app/

[14]

测测: https://www.cece.com/

[15]

StressWatch: https://apps.apple.com/us/app/stresswatch-ai-stress-monitor/id6444737095

[16]

Sensor Tower: https://sensortower.com/zh-CN

[17]

DoNotPay: https://donotpay.com/

[18]

Bill Shark: https://www.billshark.com/

[19]

Notebook LM: https://notebooklm.google.com/

[20]

YouMind: https://youmind.ai/

[21]

Gamma: https://gamma.app/zh-cn

[22]

Koji 的即刻: https://okjk.co/0JSUes

[23]

Koji 的网站: https://koji.super.site/

[24]

Ronghui 的即刻: https://okjk.co/0cbnYV