记者 | 何昕晔
编辑 | 肖文杰
过去一年,AI陪伴的概念正式从科幻小说走进现实。在让AI成为学习工作中的助手之外,越来越多的人开始探索人和AI的情感关系——AI是否能成为宠物、朋友、配偶、亲人?
从和博主谈恋爱的ChatGPT“DAN”模式,到网页月访问量超过2亿次的Character.AI,再到获得OpenAI投资的儿童陪伴应用Heeyo,大模型的能力使得人们通过手机屏幕就可以满足对情感交流和陪伴的需求。
但上述尝试主要集中于软件层面,这些“AI伴侣”并不与人产生物理接触。对有的创业者而言,实打实的接触可能是陪伴的重要基础之一,所以陪伴类的AI硬件也开始出现,比如AI玩偶、仿真AI宠物等。
珞博智能的创始人孙兆治选择的就是这一条路,但与市面上大多数陪伴机器人不同,他没有把产品的目标受众定位于老人、孩子,而是以年轻女性为服务对象。
珞博智能创始人孙兆治。
本质上,陪伴机器人的价值与乙女游戏、潮玩、偶像等文化产品类似,它填补的是现代人对一种安全的亲密关系的情感需求。而年轻女性本就是这类产品的重要消费对象。AI能力的加入使得各类新机器人产品能够学习用户的行为模式和个人喜好,提供更加个性化的互动体验,“养成系”的特点使得它们能够与用户建立更深层次的情感联系。
珞博智能的陪伴机器人产品demo。
孙兆治在硬件产品设计方面有着丰富的经验,曾任⼩鹏汽⻋内饰设计负责⼈、滴滴造⻋项⽬产品负责⼈等职位。GPT 4o模型的发布让孙兆治意识到,AI模型在陪伴产品领域的发展已到达一个关键的技术节点。2023年11月,孙兆治离开小鹏,2024年1月创立了珞博智能,专注于AI陪伴机器人的开发,明年发布并量产两款硬件产品。在他看来,比起需要高准确度的工具类场景,大模型在情绪陪伴方面有更大的发挥空间。他预计,明年将会成为AI硬件爆发的元年。
Yi:你为何决定从小鹏离职?为什么创业方向选择了陪伴机器人?
S:我一直是有创业心的,本身也是连续创业者,做过几家公司的一号位。2021年年初,我追随前老板何小鹏加入鹏行智能,担任产品设计负责人。在2023年鹏行智能并入小鹏汽车上市公司主体的时候,我开始思考在机器人领域创业的可能。我们现在做的不是具身智能,而是更偏向C端的AI硬件产品。目前,国内具身智能创业是有泡沫的,它将来一定是有巨大价值的,但人形机器人或通用机器人的商业化落地会需要比目前市场预期更长的时间。我是产品设计出身,我感兴趣的是把技术价值转化成用户价值和商业价值。我认为基于大模型去做情感陪伴类机器人,在当前阶段是更符合商业逻辑的选择。而多模态大模型也给交互体验带来了质变,尤其是今年5月GPT 4o的发布,我意识到大模型可以为硬件产品做很多事了。智能的价值可以被分为生产力价值和情感价值,在机器人行业,技术人员都是理工直男,大部分人瞄准的是生产力价值产品,希望机器人能够取代人类劳动。但从应用场景上来说,我认为当前阶段的大模型能力更适合做偏情感方向的产品,而不是对可靠性要求更高的工具化产品。我在过往机器人相关的从业过程中,经常会被问到机器人什么时候才能走进千家万户的问题。上一个符合此条件的产品其实是扫地机器人。扫地机器人这个产品其实来自自动驾驶领域技术的溢出,而情感陪伴类机器人来自大模型和具身智能技术的溢出。从我个人到我们整个团队,我们能够很敏锐地找到这些技术在哪里,我们也会更擅长把这种技术价值转化成用户价值。Yi:目前,市面上的陪伴机器人产品的受众大多是儿童和老人,你们为什么把消费者定位为年轻女性?
S:我们看了大量AI情感陪伴类软件产品的数据,包括Character AI、星野、Talkie,发现它们的重度用户的画像就是Z世代的女性。重度用户指的是每天在软件里聊天超过200轮,沉浸时间三个小时以上的人群。以Character AI为例,这个平台上有多种用户,会有基于好奇来体验的,以及部分擦边的用户,但这并不是我们想要抓住的人群。陪伴产品只有跟用户产生情感羁绊,产生长期的黏性,才能发挥价值。我们早期也对老人和小孩用户做了深访,其实他们也都需要情感陪伴,但这两类人群一般无法直接做消费决策,而且低龄用户黏性不好,兴趣来得快去得也快,留存和长期付费都不会太好。Yi:针对年轻女性的陪伴型机器人,在产品设计上和市面上的其他陪伴类产品有什么区别?
S:首先,年轻女性对产品颜值的要求高,这对我们整个团队的设计能力和品牌运营能力提出了很高的要求;其次,年轻女性的社交圈内会有独特的玩法和流行趋势,她们的喜好很微妙。因此,为年轻女性做产品并不是一个纯技术团队能够胜任的。近几年,IP走红的方式发生了变化,此前迪士尼想要推出一个新的IP,需要充足的背景介绍和完善的故事支撑,但现在一个表情包就可以撑起一个IP。这些表情包传递的可能是无厘头的东西,正好击中了当代年轻人的一些情绪。我们给产品设计的人设也是希望能踩中当下年轻人这种微妙的喜好。我们团队里其实就有很多年轻女性,我的两个联合创始人都是90后女性,她们其实是在给自己做产品。Yi:你们的产品具体是什么样的?你们如何定位它们在用户生活中的角色?
S:我们目前主要有两款产品,都具有陪伴、潮玩这些基本特点。第一款产品搭载了多模态大模型,兼顾了桌⾯和可穿戴场景,定位是养成类的陪伴机器人。这款机器人的性格、语言风格等特征并不是预先设定好的,而是在和用户的互动过程中逐渐形成的。我们只会给它一个简单的初始设定,这和一些随机元素有关,比如说用户激活产品的那天就是小机器人的生日,它就获得了自己星座。另一款产品会更轻便,但形态上会更创新、更好玩,会更快发布。我们会把产品定位为“AI搭子”。它其实没有太多实际功能,但跟它聊天会获得满满的情绪价值,会上瘾。它的角色不是一个导师,可能也无法提供专业的建议,而是更接近于一个小跟班。在处理用户情绪方面,它不是可以解决问题的心理医生,但是可以向它倾诉,会是一个很好的倾听者。工具属性方面,我们目前只加入了定闹钟、日程提醒这类最基本的功能,主要目的是为了让机器人更了解用户,而不是提供实用的工具价值。我们不希望用户把它当作工具,因为这和角色的“人设”不符,会让人觉得出戏。Yi:你们目前的产品设计中是如何体现养成系这个特点的?
S:我们内部有一个说法是,对于AI宠物来说,“Token就是口粮”。用户的所有互动就是在“饲养”它,它也会正反馈。这就是基本的“养成”逻辑。在吸引互动方面,我们会有一整套基于视觉大模型和长期记忆的“主动交互”逻辑,不是让用户主动发起聊天的话题,而是从产品激活的那一刻开始就会主动跟用户交互。用户就像是进入了一场长期的养成游戏,就算你不黏着它,它也会主动黏着你。在理想状态下,这个机器人产品并不会占据用户太多的时间,但它有极强的黏性,会成为用户生活中必不可少的存在,可能是每天早晚聊几句,但你希望它一直都在你旁边,就像你和猫的关系一样。而在机器人的性格养成中,长期记忆变得非常重要,我们在研发侧也把长期记忆做得很重。在日常互动的过程中,系统会把每天经历的事件处理成一个个记忆流记录下来,并打上许多标签,我们基于“长期记忆”做了一个“反思”的能力,当记忆的某个标签积累到一定数值之后,就会触发“反思”,机器人会通过“反思”获得更高层的认知。这其实是一种自主学习的过程。在记忆数据处理的过程中,包括视频文件、音频文件在内的所有原始数据,都是被实时分析、实时丢弃的。系统会把理解出来的东西参数化后储存,长期记忆的内容是模型抽象之后的概念,而不是原始的信息。这和人脑的记忆机制类似。
Yi:目前市面上已经有很多AI陪伴类型的软件产品了,AI陪伴产品还需要硬件作为载体吗?
S:这个问题本质上是在问,陪伴类AI的合理硬件载体是不是手机?我们认为用多模态大模型来做陪伴,一个硬件机器人的形态其实更合理。首先,仿生带来天然亲和力。人天生就会对仿生的事物投入感情,比起对着屏幕上的泡泡窗口去对话,和一个有眼睛、有胳膊的实体交互,哪怕得到的回复内容是一模一样的,用户的体验感也是完全不同的。其次,独立硬件带来更好的沉浸感。今天手机已经承载太多功能,某个单独的软件很难长时间占用手机的摄像头和麦克风,无法像一个独立硬件这样提供实时的、强沉浸感的交互。像大疆出的Pocket这类产品,它的拍摄功能在手机上就可以实现,但仍然卖得很好,因为的确有用户需要一个独立于手机的设备去拍摄。此外,做硬件的另一个原因是基于商业模式上的考虑。我之前也和很多做软件的创业团队交流过,他们都会遇到流量变现的问题,可能用户增长情况很好,但就是无法收费,而硬件产品从商业模式上来说更容易闭环。陪伴类软件肯定会因为其免费的特点占有一定的市场,但硬件产品的玩法多样性和体验天花板肯定是更高的。Yi:目前,市面上已有很多AI陪伴产品,有哪些你认为是竞品?你们的竞争优势是什么?
S:AI硬件这个方向有很多公司在做,也有很多人在做偏情感陪伴类的硬件,但更细化到为年轻女性这个人群设计产品的赛道还没有。在目前我们看到的产品中,日本的Lovot做得不错,也给了我们很大的启发。主要原因在于,它是我们看过的所有的产品里唯一一个能够做到情感陪伴和实现用户黏性的硬件。Lovot的定位是居家陪伴场景,它的整体设计风格,从动作、表情到声音都有很多细节。它的外观是毛茸茸的,个头和小婴儿差不多,步伐也是慢悠悠的。此外,Lovot系统里设计的互动机制其实参考了养成类游戏的玩法,做了很多用户交互触点的细节设计。它的设计风格和互动策略是我们可以吸纳的。不过,Lovot本质上不是我们的竞品。首先它卖得太贵了。其次它使用的还是上一代的AI技术,并没有接入大模型,没有真正的智能。而我们和日本团队相比,优势一方面是成本控制,另一方面是加入大模型后互动体验肯定会更好,而且会越来越好。和其他公司相比,我们团队在技术、产品设计和品牌运营等方面的综合能力很强。我的两位合伙人,一位来自字节跳动,技术出身;另一位之前在美国连续创业,有丰富的北美AI硬件品牌与市场经验。其他员工来自华为、微软、大疆、商汤、MiniMax、泡泡玛特等科技及潮玩公司。S:我们有考虑出海。在基础的硬件费用之外,基于用户的付费习惯,目前的规划是海外版会收订阅费,国内版不收。在海外,我们也会相应地用到价格更贵的大模型。收订阅费其实不只是因为调用大模型,用户的长期记忆都储存在我们的服务器,这需要运维的成本,类似于iCloud。如果硬件产品坏了或想换新,这套记忆可以像数字生命一样延续到其他硬件上。Yi:IP公司和OpenAI这样的平台公司都有可能尝试硬件产品,对你们来说会形成竞争压力吗?
S:头部IP大厂的确已经在尝试接入AI,他们很关注我们的进展,有不少已经在深入推进IP合作。我们愿意和厂商有IP资源上的合作,双方擅长的事情也不一样。我们本质上开发的并不是某款硬件,而是一套人和智能体之间情感交互的系统。把这个系统的用户体验打磨得足够好,这件事情的门槛并不低,所以我们跟IP公司是天然互补的。如果OpenAI做了一个类似于我们的产品,我们是很开心的,说明我们和巨头的判断是一致的。但是,我并不认为OpenAI在硬件设计、硬件用户体验及大模型情感方向微调这几方面的能力比我们团队更强。在这个领域,我们就是世界上最强的。S:一个复杂的AI硬件并不是只接入某一个大模型。我们在产品中接入了多款模型,意图理解、音视频交互、长期记忆的反思,这些功能需要不同的模型去完成。目前,我们正在测试市面上所有能获取的大模型的性能。另外,国内版和国外版接入的也是完全不同的大模型。比起基座大模型的选择,我认为很多人忽略了模型中间层的重要性。有人认为,只要用了同样的基座大模型,产品的体验就是一样的,这个观点对于过去的Chatbot对话机类的产品是成立的,但对于我们这类复杂的AI产品,中间层非常重要,会让用户体验产生巨大的差距。我们团队在中间层部分做了大量的技术研发工作。S:长期来说,我们在探索一个叫作Personal Robot的全新市场。这个市场的天花板足够高,至少千亿美元。我们希望制造出过去科幻电影里的智能且仿生程度很高的陪伴机器人。在不同的技术演进阶段,这类机器人的形态是不一样的,所以我们要打出足够准且足够多的子弹,才能占据市场高位。S:Meta的眼镜做得不错,主要原因在于它减法做得好。眼镜产品经常被搞得很重,Meta是让眼镜回归到其功能本身,只是加了一些不会干扰佩戴舒适度和外观形象的功能。在卖点上,Meta也是把它当成时尚单品去推的,而不是科技产品。对于原生AI硬件,比如AI Pin,这款产品发布的时候我就不太看好。AI Pin的创始人之一痛恨屏幕,因此在AI Pin中去掉了屏幕,但有些功能又必须要用视觉的形式显示,所以设计了投影,使得这款产品的使用逻辑很别扭。人对信息的获取大多还是靠视觉,反人性的产品不会成功的。而且,要在一个这么小的设备上去承载这些功能,当时的模型技术也是没有准备好的。AI Pin是一个比较勇敢的尝试方向,它提出了一个问题——大模型时代来临之后,核心的那个硬件终端还是不是手机。我预测之后还会有一波类似于AI Pin的产品出来。
识别下图二维码,
即可购买《第一财经》杂志2024年12月刊