专栏名称: GGV纪源资本
不止是VC。
目录
相关文章推荐
51好读  ›  专栏  ›  GGV纪源资本

亚马逊做了 10 年 Alexa,还是失败了,为什么?|亮马桥小纪严选

GGV纪源资本  · 公众号  ·  · 2024-11-14 10:30

正文




小纪有话说:


十年前,2014 年 11 月 6 日,Alexa 发布,对贝佐斯来说,这个项目代表着未来。


名字来源于《星际迷航》中的「计算机」,语音控制的全能 AI 助手。


「从科幻小说的早期开始,人们就梦想着能够拥有一台可以自然对话的计算机,实际上可以和它交流并让它为你做事。如今,这个梦想终于实现了。」贝佐斯说


两年时间,智能音箱 Echo 进入 500 万个家庭,现在美国市场销量已经超过 4000 万台。 但很多想象中它能做到的事,Alexa 没有做到。

来源:Founder Park
原标题: Alexa 做了 10 年,销量 4000 万台,却还是一个智能闹钟

十年了,Alexa 还只是个智能闹钟

Echo 智能音箱在美销量超过 4000 万台,Alexa 每周处理全球数十亿条命令。
现在的 Alexa,依旧在做它最基础的事情:播放音乐、提供天气信息、定闹钟。你可以用 Alexa 控制家中的灯光、打电话给妈妈,或者提醒你丢垃圾。
但正如一位前 Amazon 员工所说:「 虽然雇了一万多人,结果我们做的还是一个智能闹钟。」
这让人有些失望。Alexa 原本有着巨大的潜力。尽管它的功能非常强大——特别是在无障碍技术和老年护理等领域,对于很多人来说它变得不可或缺——但它现在基本上还是家里的一个遥控器。现在,家里每个房间都有 Alexa 智能扬声器,但它并没有让生活变得更便利。虽然这些年 Alexa 加入了成千上万的功能,但我仍然不会依赖它做一些比执行计划中的命令、将牛奶加入购物清单,或者告诉我小鸡能不能吃葡萄之类更复杂的事。
如果非要说有什么变化,那就是在 语音助手诞生 10 周年之际,Alexa 最初的梦想似乎变得更加遥不可及了。
当 Alexa 首次推出时,它是多么具有突破性。不同于苹果的 Siri 被束缚在手机里,或者微软的 Cortana 被局限在电脑上,Alexa 走出了自己的路,搭载在 Echo 这款世界上首个语音激活扬声器里。它的远场语音识别技术,凭借七麦克风阵列提供支持,真的是让人惊艳。你可以在房间的任何地方对着 Echo 喊话,那个蓝色光圈几乎总是会亮起,表示 Alexa 已经准备好为你讲笑话或者设置定时器了。
Amazon 进入智能家居领域,为我们揭开了「星际迷航」般的未来的序幕。尽管有些玩笑话和百科全书式的知识不太靠谱,但 2016 年发布的 Alexa 智能家居 API,之后 2017 年 Echo Plus 加入了 ZigBee 无线电,使得 Alexa 可以连接并控制我们家里的各种设备。
坐在沙发上让 Alexa 关灯,或者躺在床上让温控器升温,感觉就像生活在未来。我们终于在家里有了一款类似《星际迷航》中的「计算机」的设备——Amazon 甚至让我们称它为「计算机」(Computer)。
回头来看, Alexa 其实为现代智能家居铺平了道路 。简单的语音控制让物联网(IoT)变得更普及,它把技术带入家庭,而不是让它被困在复杂的设备里。加上 Amazon 的开放式智能家居策略——在其他公司都推出封闭生态系统的时候——也促进了一波新消费级智能设备的崛起。Nest、August、Philips Hue、Ecobee、Lutron 和 LiFX 等品牌的成功,部分功劳要归功于 Alexa 的易用性。
然而,围绕 Alexa 的生态系统发展得太快了。任何人都可以为 Alexa 开发「技能」,几乎没有什么限制。虽然有些技能简单有趣,但很多功能不稳定,甚至需要特殊的词句才能激活。最终,这导致了一个不稳定、常常令人沮丧的使用体验。

Alexa 的问题在哪里?


Amazon 通过不断扩大的 Echo 硬件产品线来掩盖 Alexa 没什么智能的问题。
每年都有新款智能音响发布,Alexa 也逐渐进入了时钟和微波炉等设备中,还推出了多种新形态,试图推动用户将 Alexa 带到户外——比如耳机(Echo Buds)、戒指(Echo Loop)、眼镜(Echo Glasses)和车载设备(Echo Auto)等。
然而,这些设备大多让人留不下印象,对提升 Alexa 的功能几乎没有帮助,反而让 Amazon 背上了亏损。今年,《华尔街日报》报道说, Amazon 在设备部门的损失已经高达数百亿美元。
即便采取了这种「什么都试试,看哪样有效」的策略, Amazon 还是没能突破那个第二个必不可少的形态 。2017 年,它推出了智能显示器——一种带触摸屏的 Echo,可以进行视频通话、查看安防摄像头,甚至显示信息,而不只是简单告诉你。但由于处理器速度慢、触摸屏不灵敏,且广告过多,智能显示器并没有真正提升 Alexa 的核心功能。
现在,很多用户都抱怨 Alexa 在核心功能上变得更差了。大家买 Echo 设备,主要是因为它比其他竞争产品便宜,并且能做一些 Alexa 2014 年就能做的事:定闹钟、查天气、听音乐。
对这种价格最低可至 18 美元的设备,人们的期待也并不高。
这么多年过去了,和 Alexa 对话依然是最大的难题。而且是 我们学会了如何跟 Alexa 说话,而不是 Alexa 学会了怎么和我们沟通 。例如,我家里连接的厨房水龙头,还需要我说:「Alexa,告诉 Moen(水龙头品牌)给我倒 2 杯热水。」正如我丈夫所说,如果 Alexa 真那么「聪明」,它应该知道我正在厨房水槽前,直接按照我的要求做,而不是让我记住这些复杂的指令。
还有就是,Alexa 遇到了技术瓶颈。在科技界,有一个普遍的预期,那就是技术会持续进步。但 Amazon 并没有专注于提升核心技术,而是依赖第三方开发者让 Alexa 拥有更多的功能,集中资源将语音助手推向更多设备,并让它能控制更多的东西。
随着越来越多设备支持 Alexa,Amazon 在平台上增加了更多功能,但也带来了管理、控制和使用这些设备的难度。语音控制非常适合简单的命令,但如果没有更方便的方式与 Alexa 互动,很多新功能对于大多数用户来说就变得毫无意义。
Amazon 推出 Alexa Routines(Alexa 常规任务)作为解决方案,帮助用户整合可以用 Alexa 控制的各种设备和功能,但这需要你花时间在应用里进行设置,并且不断调试设备和它们的连接问题。
每次发出命令后听到「您的『2 灯』没有响应,请检查网络连接和电源」这种提示,真的让人非常沮丧。而每个月花上几个小时来配置和解决智能家居的问题,这并不是 Alexa 当初承诺的体验。
一个智能计算机应该能为你做的事情,结果现在却成了负担。

比 OpenAI 早十年的构思


十年过去了,Alexa 依然主要是用来播放音乐、问问题和看天气。这很大程度上是因为,尽管 Amazon 让 Alexa 在各种设备和家庭中普及开来,但始终没能让开发者真正关注它。
Alexa 本来是没有应用商店的。相反,它有「技能」(skills),Amazon 希望开发者通过这些技能让 Alexa 连接到新的功能和信息。开发者不需要在操作系统上搭建自己的应用,而是要为 Alexa 开发新的功能。这个区别虽然细微,但却至关重要。我们的手机大多是孤立的体验——Instagram 和 TikTok、Snapchat、日历应用和 Gmail 各自独立,互不关联。这种方式对于 Alexa 或任何其他成功的助手都不适用。如果 Alexa 知道你的待办事项,但却不知道你的日程安排;它知道你喜欢吃什么披萨,但却不知道你的信用卡信息,那它能做的事情就非常有限。 Alexa 需要获得所有必要的信息,并且能调用各种工具,才能帮你完成任务。
在 Amazon 的理想世界里——那里「环境计算」无处不在且完美无缺——你只需要向 Alexa 提问或下达指令:「帮我找个有趣的活动做做。」「帮我预定下周去纽约的火车票。」「帮我了解一下深度学习。」Alexa 会访问所有必需的应用和信息源,而你不需要担心这些细节;它会根据需要处理并为你提供答案。虽然关于如何实现这一点的问题非常复杂,但这是 Amazon 的整体目标。
「Alexa Skills 让开发者能快速、轻松地创建语音驱动的体验,为开发者和品牌与客户的互动打开了全新的方式,」Amazon 的发言人 Jill Tornifoglio 在声明中说。她表示,客户每年使用这些技能的次数达数十亿次,并且随着公司拥抱生成式 AI,「我们对未来充满期待。」
回头看,Amazon 的这一想法几乎是完全正确的,且超前的。
多年后,OpenAI 和其他公司也在围绕聊天机器人构建自己的第三方生态系统,聊天机器人就是互联网交互界面的一种新形式。但尽管 Amazon 对 AI 革命的预见非常精准,它却从未搞清楚如何让技能真正发挥作用。它始终未能解决开发者面临的根本问题,也未能突破用户界面的难题,更 没有找到一种方法,让用户意识到他们的 Alexa 设备其实能够做很多事情,只要他们愿意去问。
Amazon 确实尽了最大努力让「技能」成为现实。
公司不断为开发者推出新工具,当他们的技能被使用时,提供 AWS 积分和现金奖励(尽管最近已经停止了这种做法),并尽力让技能的开发变得几乎毫不费力。从某种角度来说,这些努力是有回报的:Amazon 表示,平台上已经有超过 160,000 个技能可供使用。虽然这个数字远不及智能手机上的数百万个应用,但依然是个相当可观的数字。
然而,发现和使用这些技能的界面一直都是一团糟。举个简单的例子:如果你让 Alexa 帮你点披萨,它可能会告诉你它有几个技能,并推荐 Domino's。你回答「好」。「这是 Domino's,」Alexa 说。然后又过了一会儿,Alexa 又说:「这是 Domino's 技能,由 Domino's Pizza,LLC 提供。」再过一会儿,「要链接你的 Domino's Pizza 账号,请到 Alexa 应用的技能设置中去。我们需要你的邮箱地址才能进行客人订单。请在 Alexa 应用中开启『邮箱地址』权限。」这时,你必须找到一个你可能根本没有在手机上下载的应用里的设置;直接去 Domino's 官网或打个电话不就更简单吗?
如果你知道自己想用的技能,情况会稍微好些。你可以说「Alexa,打开 Nature Sounds」或「Alexa,启用 Jeopardy」,它会打开对应的技能。但如果你忘记了那个技能的名字,像「Easy Yoga」这个名字之类的,单纯让 Alexa 开始一次瑜伽训练就没那么优秀的反应了。
这种系统的问题到处都是。当你启动了一个技能,你必须明确地说「停止」或「取消」才能退出并使用其他技能。你不能轻松地在技能之间切换——比如我想检查披萨的价格,但 Alexa 根本不允许我这样做。而也许最让人沮丧的是,即使你已经启用了某个技能,你仍然得专门提到它。比如说「Alexa,让 AnyList 把意大利面加入我的购物清单」,这并不是和一个全知助手的无缝互动; 这相当于得学习计算机那种特别具体的语言,才能正常使用它。

成功的 Skills 也只能靠广告挣钱


最终,事实证明,最受欢迎的 Alexa 技能有两个共同点: 它们通常都是简单的问答游戏 ,并且大部分是由一个叫做 Volley 的公司制作的。从《Song Quiz》到《Jeopardy》,再到《谁想成为百万富翁》以及《你比五年级生聪明吗》,Volley 是其中一家真正懂得如何让技能发挥作用的公司。Volley 的联合创始人兼 CEO Max Child 表示,将你的技能展示给用户是最重要也是最困难的部分之一。
「我认为 iOS 和 Android 应用商店如此成功的一个被低估的原因就是 Facebook 广告太强大了,」他说。通过精准的广告投放到应用安装的流程,已经被完善了多年,而语音助手却没有类似的流程。最接近的可能就是人们询问 Alexa 能做什么的时候插入广告,但这与信息流广告和社交媒体刷屏的效果相比差得远。「因为没有那种精准的营销,你只能做广泛的营销,只能做广泛的游戏。」因此,像《Jeopardy》和《Millionaire》这样的游戏成为了大众化的品牌,几乎适合所有人。
Volley 的盈利方式之一是通过订阅。例如,完整版的《Jeopardy》每月收费 12.99 美元,像许多现代订阅服务一样,订阅比取消要容易得多。这也是为技能赚取收入的少数途径之一:开发者可以在某些技能中插入音频广告,或者直接要求用户填写信用卡信息,就像 Domino's 做的那样,但让语音优先的用户去拿起手机,翻阅设置,实在是个很高的门槛。广告只有在足够大规模时才有用——曾经有段时间,很多媒体公司认为「闪电简报」会成为一个热门,但并没有发展成预期的那样。
顺便提一下,这些 Alexa 面临的挑战并不特别。移动应用商店也面临类似的投放难题、货币化难题、亟待优化的订阅模式等等。只不过在 Alexa 这里,解决方案本应是如此引人向往:你不需要,也不应该需要应用商店。你只要说出需求,Alexa 就能帮你搞定。
十年过去,看来一个无所不能的全能语音 AI 可能确实难以实现。这几乎成了一个悖论:
如果 Amazon 能够做到一切都无缝和快速,你甚至不需要知道自己在和第三方开发者互动,披萨也能神奇地出现在你家门口,那样就会带来巨大的隐私问题,同时也引发人们对 Amazon 如何选择服务提供商的质疑;






请到「今天看啥」查看全文