专栏名称: 极客公园
科技创新者的大本营。汇聚优秀的产品报道、评测视频和高质量的线下活动。
51好读  ›  专栏  ›  极客公园

人工智能 +「以图搜图」,细分巷道里的千亿级市场

极客公园  · 公众号  · 科技媒体  · 2016-11-24 15:35

正文

 极客公园微信号:geekpark

图像识别 

「国外有谷歌,国内有百度,再想做一搜索产品还有什么机会?」

这是几年前就困惑着黄鼎隆的问题。那时候,他还在微软的 Bing 团队任职产品经理。那是一款 2009 年推出的、被微软寄予厚望的搜索产品,时任微软 CEO 的史蒂夫·鲍尔默甚至承诺将会有 60 亿至 120 亿美元投入到 Bing 的开发——这相当于当时微软运营收入的 5% 至 10%。

但是现实很骨感。在海外,Bing 的市场份额一直屈居于 Google 之后,国内更不敌百度。「竞争对手已经占据了市场先机,技术也非常好,如果一定要打胜仗,唯一的机会就是搜索的对象要有变化。」黄鼎隆说。

这个「搜索对象」最终被他认定为二维图像。2014 年,从微软离职后又先后就职于腾讯、TripAdvisor 公司的黄鼎隆和在微软时的旧搭档 Matt Scott,创办了码隆科技。这家公司目前推出的两款产品都致力于利用 AI 的视觉识别技术来识别商品。

根据平安证券发布的一份关于「人工智能图像识别」的专题报告显示,图像识别正在多领域被广泛应用,而且具有巨大的市场空间。在现实中,图像识别的应用已经在金融、安防和医疗领域被提前布局。但是在黄鼎隆和 Matt 看来,把人工智能技术直接跟「交易」相关的领域结合,提高生产效率,将是把人工智能技术推向成熟商业化的最短路径。

这一定程度上也是这家公司的内在价值观念:高高在上的人工智能技术,必须要找到细分的巷道落地,它必须成为生产力工具,才能产生他应有的效能。

码隆科技创始人黄鼎隆和 Matt Scott

人工智能的商业化落地:2C还是2B,是个问题

真正让黄鼎隆开始感到创业计划可行的起因,是相关产业链的陆续成熟。这个具体的信号来源于 ImageNet 的比赛结果:在 2010 年,ImageNet 比赛图像识别中对象分类项目的准确率是 72%,到了今年,这个数字达到了 97%。这项由斯坦福、卡内基梅隆、北卡以及密歇根等一流名校发起的一项计算机视觉竞赛,一直是计算机视觉方向发展的风向标。而 97% 的分类项目识别准确率则代表着,机器视觉的识别能力已经超过了人类。

这算是质的飞跃。2014 年,黄鼎隆觉得之前自己一直在思考的产品方向终于有机会成型。

关于图片的识别和搜索技术,其实一直在百度、谷歌等公司的搜索框架体系下有所成长,但是由于对图片中各种元素的标记效率低下等原因,搜索的结果准确率与文字搜索相比还有很大差距。

最开始,码隆科技推出的是一款面向 C 端的产品:Style AI。这款产品的功能被定位于用人工智能为用户「打造时尚」,为此,这个技术团队还专门聘请了一位服装设计师作为时尚顾问。通过识别用户上传的图片,Style AI 可以识别出图片中的同款服装商品并给出搭配建议,同时附带购买链接。

用人工智能切入「时尚」领域,这算是一个「讨巧」的方向。但是这个 to C 的 app 面临着较高成本的用户推广问题,这是擅长技术的码隆科技团队相对欠缺的方向。另一方面,为电商导流的「识图」技术似乎很难带来用户积累,的商业想象力也实在有限。

这是黄鼎隆和团队从 Style AI 里摸索出的道理:如果想要更快实现商业化,就必须用更开放的心态,把技术开放给更多成熟的商业力量使用。于是,这家公司的解决方案是及时转型:2016 年,码隆科技又推出了面向 to B 用户的 Product AI。

这款新产品的最大价值是为「以图片为驱动」的商业网站实现低门槛的以图搜图功能。背后的技术逻辑是相通的:通过机器学习,分析上亿个训练素材,从而形成对图片中各种元素的认识和了解后,机器就可以根据某一素材的「内部规律」,识别和搜索目标图片中的语义标签。根据黄鼎隆给出的数据,目前 Product AI 能够识别的㲏准确率已经优于人工识别,而相对于原本传统的「人工贴标」的方式,这家公司提供的解决方案提高了 8% 左右。

其中,柔性的服装类商品是这家公司最先切点入,也是把识别率磨砺的最为锋利的领域,但放大到其他领域时,这套系统依然能够发挥作用。与此同时,黄鼎隆也提到了自家产品与百度等平台的「以图搜图」功能不同之处:当人们进入某些网站上搜索图片时,希望找到的也许不是与原图「一模一样」的图片或者商品,而是「同款类似」的图片或者商品。他对极客公园记者以 Product AI 的 B 端客户视觉中国为例做了一个展示。

同样以一张「正在化妆的女模特」作为原图搜索时,百度和接入 Product AI 的视觉中国分别给出了以下的搜索结果。

百度展示的搜索结果

植入 Product AI 的视觉中国展示出的搜索结果

视觉中国网站中出现的一排标签,就是 Product AI 根据对原图片的认知自动标注的。

「有时候我们需要的不是骑驴找驴,而是骑驴找马。比如一个设计师进入类似视觉中国这样的网站时,他需要找到的也许是某种特定地素材,比如一个化妆的模特,而这时候他只需要上传一张类似的图片,机器就可以帮他识别出他需要的素材中的标签是什么,从而帮他找到更多选择。」黄鼎隆解释。这种解决方案也可以根据 B 端客户的需求进行修改。

1.2 万亿次图片搜索背后的千亿级机会

简单说,这家以人工智能作为技术驱动的公司现在的新方向,就是寻找那些需要植入或者升级图片搜索需求的商业网站进行合作。黄鼎隆对于合作伙伴的选择有一个基本原则,那就是对方的产品必须有「交易属性」。

也就是说,在某个以图片(比如视觉中国)为主要驱动的商业网站里,Product AI 可以根据对方提供的图片以及视频数据,专门为该网站建立或者升级搜索引擎。同时帮助该企业实现图像标记、分类、聚类和定位等功能。最终在每一次搜索过程中,网站用户可以更加轻易的做出购买决定。

「人工智能技术应该落到一个可以发挥实际商业作用的领域里去,而我们认为交易才能够产生现金流。」黄鼎隆说。现在,码隆科技 Product AI 已经通过 API 接口开放给的合作伙伴包括:视觉中国、微软在线、瑞丽、暴风影音、优料宝(纺织品交易平台)等等。而每笔通过「以图搜图」行为产生的购买行为发生时,码隆科技则可以得到一定份额的分成。

这实际上构成了码隆科技这家公司商业化的最初探索。根据黄鼎隆介绍,该公司已经实现正向现金流,并且在今年 10 月刚刚获得了来自达晨创投和远镜创投、中信建投等机构的 6200 万 A 轮融资。

目前,这家以人工智能作为驱动的公司现在切入的领域似乎很难定义,它和「购买」、「交易」有关。这个概念似乎过于宽泛,但是黄鼎隆认为:「粗略的说,我们希望做的是把任何一个图片跟某一个商品连接起来,这个事情产生的价值可以跟一般的搜索引擎类比,根据谷歌每年的收入,除以每年搜索量,可知每一次产生的链接,他产生的价值是 7 美分,而全球去年有 1.2 万亿次的搜索量。而一张图片跟一个商品连接起来的时候,保守估计每次链接能够产生的价值是 5 美分,全球每年产生的图片搜索量是 1.2 万亿次。如果把同时快速增长的两个变量相乘,得到的结论大概就是以图搜图这件事能够产生的商业价值,你可以期望它能获得千亿级别的空间。」

当然,这只是黄鼎隆目前的构想和预设。当市场空间足够庞大和这家公司的技术足够领先时,商业上的想象力能否落地,对这家初创公司的考验依然不小。根据艾媒咨询发布的一份关于《2016 年上半年移动搜索市场研究报告》调查显示,至少在移动端,目前在国内搜索市场,89.7% 的用户偏好使用文字进行搜索,排名第二的搜索偏好则是语音搜索,以图搜图的使用偏好仅有 25.3%。同时,包括百度、阿里巴巴以及搜狗等巨头也开始在图片搜索方面发力。

不过最起码,他们已经初步在回答「人工智能+?」问题中的空格该怎么填充,

然而黄鼎隆和码隆科技依然可以看做是一个样本。现在人们已经不可否认的是,未来在人工智能领域将会产生千亿级别的大公司和生意,它有潜力做到任何人类可以做的事情,并且做的更好更快,根本意义在于促成社会生产效率的提升。不过无论是硅谷还是中国,人们暂时都无法预测这个「巨大的机会」到底什么时候到来,所以在此之前,作为一家创业公司,也许现阶段尽快筑建起自身技术壁垒,并且生存下去才是更关键的命题。

编辑 | 王伟


本文由极客公园原创

转载联系 [email protected]


/ 更多阅读 /