1)
几年前转载过一篇
《步行如何成为我的生产力系统》
,作者 Craig Mod 登上过《Wired》《The New Yorker》、《The Atlantic》、《Eater》等杂志。
在他的启发下,结合如今的 AI 大语言模型、Agent 智能体硬件,
我 hack 出一套自己的「步行生产力系统」。
更准确地说,是在步行/开车/运动/泡澡/喝咖啡等场景下,充分利用闲置时间、抓住瞬闪灵感的一只 AI 语音助手。
它能够记录笔记、录入工作提醒、运行指定脚本等。后续还有更强大的想象空间,而且完全自主可控、可升级可进化。
2)
其实我高中就开发了类似按键精灵的「共享软件」(这个词,现在应该没几个人记得是什么意思了吧)。后来升入大学,看了看了《钢铁侠1》,觉得贾维斯太酷了,于是立即屁颠颠地回到寝室,加入了声控模块,做出了语音助手。
(此事
在这个历史悠久的公众号上亦有记载
。顺便说一下,现在 TonyStark.ai 这个域名也在我手上,可惜 Jarvis.ai 是不可能抢到的。)
后来智能手机飞速发展,原生语音助手 + 蓝牙耳机已经能完成很多事情,于是我的语音助手之梦拉下帷幕。
然而近年,AI 大语言模型(尤其是 DeepSeek 为代表的开源模型!)的发展,又让事情变得有趣了。一方面,输入端的语音指令可以更加变化万千,另一方面,输出端要执行的任务也因为 AI 得到了空前的想象空间。
于是,我又按耐不住爱折腾的性格,捣鼓起来。
3)
因为不想从头发明轮子,想尽量嫁接现有成品,快速出个 demo,于是我就先尽量选用了市场上现成可买的硬件方案,配合集成好的 AI,再加入一点 hack。
这次选用的是字节跳动旗下的豆包出品的智能体耳机 Ola Friend。春节前淘宝下单,千元出头,体验不错(非广,字节打钱)。
1. 佩戴舒适性:单只仅 6.6 克,非常轻盈,戴起来近乎无感。连续戴 6 小时左右才开始有一点胀耳的存在感。我是经常晚上睡前戴着看油管视频入睡。
2. 音质表现:就那样,听个响。
3. AI 交互体验:Ola Friend 的最大亮点在于其与豆包 AI 的深度整合。手机装豆包 App(外加启用一堆权限),喊「豆包豆包」就能进行各种操作。
4. 续航能力:单次充电可持续使用约 6 小时,而充电盒则能提供总共 28 小时的续航时间。 而我为了安全和舒适,通常只戴单边,所以最多可以用 12 小时,基本覆盖白天醒着的时间了。
整体评分:7.5/10
如果你是效率党,需要解放双手、充分利用一切夹缝里的时间获取信息,或是对周遭充满好奇,那可以考虑入手。
4)
以 Ola Friend 为硬件原型机,我通过开发,实现了以下功能——
-
当激活它后,说「记笔记 XXXXXX」,我的 Obsidian 「今日笔记」(以今天这个日期命名的笔记)就会增加一条上述的「XXXXXX」笔记条目。
-
说「记任务/记todo/提醒我 OOOOOO」,Obsidian「今日笔记」就会增加一条「OOOOOO」为内容的、带 checkbox 的条目。
-
说「执行脚本 △△△△△△」,它就会在我的服务器电脑上,执行预设的「△△△△△△」的 Python 脚本。
-
说「抓取全网新闻」,它就会去我指定的 20+ 个全球媒体抓取当天更新的上千条新闻,并通过本地部署的 DeepSeek-R1,帮我整理成「奏折」供我第二天扫阅。