文|折野
如果每个人的头顶上方都可以漂浮着「姓名」标签,或许就不再会有一种叫「脸盲症患者」的生物了。当然,这个世界还远没有这么科幻。不过针对植物的「脸盲症」,已经有人发明了可以瞬间治愈的「灵药」——1秒识花APP「形色」。
这款应用的开发者是杭州大拿科技一群爱钻研「黑科技」的工程师:CEO陈明权和他的研发小伙伴们。已为人父的陈明权身上却似乎依然保有「技术拯救世界」的少年心气,「很多产品市面上找不到更好的,那就自个做一个。」
「形色」原本也是内部基于兴趣孵化的产物,如今它终于要戳破外壳独立生长了。
创造一个「植物学家」
孩童大概是世界上好奇心最丰盛的物种。处于高度敏锐状态的感官收集回所有外界信息,问题就从他们口中一个接一个蹦出来。可在他们眼中无所不能的成人也并非「百科全书」。有了孩子之后,陈明权突然意识到自己对于自然世界认知的空白。「孩子经常问我路边的花叫什么名字,但我都不知道。」
辨别植物并不是件容易的事。全球已发现的植物大约有50万种,其中已被「赐名」的植物大约有35万种。要记住它们的形态,并在看见实物那一秒迅速提取记忆无疑是个高难度挑战。传统的植物爱好者除了通过阅读书籍深化内功之外,也会通过各种渠道向业内学者取经。《博物杂志》的官微「博物君」因自带逆天「生物辨别技能包」,曾一度被视为动植物脸盲者的救星。但每天几千条的「求鉴定」信息等着被翻牌,博物君也无法做到「雨露均沾」。
相比于人工识别,通过计算机深度学习来识别植物是很多创业者希望达成的目标。此前市面上也有一些针对「植物识别」的应用,如Like the garden, Leafsnap,花满城,发现识花等,但辨别率还不够高,使用体验并不理想。
看了一圈,陈明权决定自行开启攻关模式。2015年5月,陈明权和内部核心技术团队开始着手搭建模型,「应用深度学习技术,通过数据来训练人工智能的识别引擎。」整个过程就像培养一个孩子成为植物学家:先教会他如何辨别植物,再给他提供大量新鲜素材去学习,帮助他完成从「新手」到「专家」的进阶。
历经一个半月的研发,智能识花APP「形色」诞生了。
从0到4000的逐级进阶
在「形色」产品内部有两条植物鉴定渠道:引擎识别和人工识别。
引擎识别是「形色」的核心功能。用户通过拍摄或从图库中选取照片提交,引擎将自动对图片进行分析,给出三个可能性最大的选项。技术模型经历了数次优化,引擎的识别功能也在逐步增强。但在庞大的植物物种面前,处在「学习-进化-再学习」过程中的引擎仍然可能碰到未知领域。此时人工鉴定区将作为一块有效补充,「 引擎无法识别出的植物,用户可以帮助我们识别。」
在「形色」上线初期,团队曾在各大植物花卉论坛发声。循声而来的第一批用户多是偏专业性质的植物研究学者或是深度植物爱好者。对于「植物鉴定」的热情促使他们涌入了人工鉴定区,成为了版块内的活跃分子。当用户鉴定完成后,结果也将被纳入学习素材库,用于识别引擎的进一步训练优化。
历经数次迭代,目前「形色」已经可以识别 4000 多种植物,识别率为 88%,反应速度只需1秒。
在技术团队强化产品骨架的同时,内容团队也在致力于丰富产品的血肉。在每株植物的介绍页面,除了植物名字之外,也会增添「一花一名」、「诗词赏花」、「植物文化」等类目版块。区别于百度百科和维基百科科普化的描述方式,内容团队在编写词条时会特意让内容显得通俗易懂,让父母在教育孩子时更得心应手。
通过口碑传播,「形色」累积了十几万用户。今年7月中旬,「形色」登上了苹果App Store 的首页推荐。无数新用户涌入,服务器一度濒临瘫痪。当时的场景,陈明权印象深刻,「连夜加班升级了服务器,抗住了压力。」而在此之后,各类平台也开始接连推荐,为「形色」引入了大量用户。用户群从爱好植物的圈内人开始向大众辐射,这让陈明权看到了「形色」的潜力,「植物识别并不是一个小众的事儿」。
小而美的工具,未来会是什么形态?
上线了「地图」功能之后,「形色」看起来不再像是个「单机模式」下的工具了。用户每上传一张照片,都会在地图上留下痕迹。通过点击地图上的图片,用户可以查看植物的相关信息,也可以给上传者发送信息进行对话。附近爱好花木的同好可以汇集成一个小圈子交流——这看起来像是一个植物爱好者社区的初级形态。
在工具的基础上搭建社区是小而美的工具类应用常见的玩法。工具虽然可以解决用户需求,但在建立和人的关联上却有着先天缺陷。社交模式的引入则可以很好地提升工具的使用粘性,待用户基数提升之后,从社区转向电商则是一条可行的变现路径。但这条路走起来并不容易,在工具版块功能尚未成熟时开放社区反而可能伤害用户体验。
当问及「形色」未来的产品形态,陈明权希望把决定权交给用户,「在原点的时候可能是我们去猜测用户的需求。但之后产品的功能,设计都应该是由用户驱动的。」
未来一切的可能性仍然要依靠工具打下的「地基」。2016年9月28日,互联网巨头微软推出了一款应用:「微软识花」,同样可用于植物识别。面对巨头的追赶,陈明权认为真正做到「精准识别」才是未来决胜的关键。现阶段,团队仍会将主要精力花在识别率的提升上。「现有的引擎识别后会提供三个选项供用户选择,这种方案还是有一定的使用门槛。未来让数据更精确,训练模型更优化,它就可以直接给出最终答案,不需要用户去做比对。」
听起来,「形色」又将开始新一轮的「内功修炼」之旅。未来的路还很漫长,这个小而美的工具会开启属于它的天地吗?