专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
目录
相关文章推荐
新浪科技  ·  【#全国首个无人机4S店开业# ... ·  19 小时前  
新浪科技  ·  #小米SU7全年交付量已超过13万#,#小米 ... ·  22 小时前  
新浪科技  ·  【#彩虹星球诉王海侵权案一审胜诉# ... ·  3 天前  
51好读  ›  专栏  ›  DeepTech深科技

社交网络美食照太多?麻省理工学院开发的AI能一眼识别它们的“本体”

DeepTech深科技  · 公众号  · 科技媒体  · 2017-07-21 21:26

正文

 

你想拍一张食物的照片,然后就得到这种食物的菜谱吗?


最近,麻省理工学院计算科学与人工智能实验室(CSAIL)的研究人员创建了一款名为 Pic2Recipe 的应用,它就能很好地做到这一点。

 

图丨Pic2Recipe 应用


这款应用基于一种被研究人员叫作“Recipe1M”的新型神经网络,从“理论上”来说,它可以根据上传的食物图像,然后给出图像上所描述食物的配方。不过在此之前,就有利用人工智能来识别食物的例子。在 HBO 出品的情景喜剧《硅谷》中,Erlich 和杨建开发的“热狗识别”应用就曾引发了 AI 界对于食物识别的热烈讨论。另外,图片社交平台 Pinterest 推出的视觉搜索工具 Lens,被用户用的最多的竟然也是识别食物。所以有人戏称,2017 年人工智能的主要应用,就是识别食物。

 

图丨《硅谷》中的“热狗识别”应用


CSAIL 的研究人员将在本周计算机视觉与模式识别大会的的参会论文中详细描述这一神经网络的细节。但是简单地说:研究人员为这个神经网络“喂”了 100 多万个食谱和近 100 万张食物图片。在这一训练过程中,它更加完善了食谱中的内容与食物照片之间的密切联系,然后将其结果返回到 Pic2Recipe 应用的界面中。

 

这个应用让人想起了我们之前所见过的那些低保真的看起来很傻的基于人工智能学习系统 TensorFlow 的项目,比如 edges2cats 或 Pix2Pix。不过,这个应用的反馈结果并不会像那几个项目那样让人吃惊不已。它只是根据你上传的食物照片来抓取食谱,并根据系统的确信程度来对食谱进行排名,然后给出结果。

 

图丨Pix2Pix 糟糕的识别能力


但是就像我们在前面说的,它只是在“理论上”能实现这种功能,因为在一系列的简短测试中,Pic2Recipe 几乎没有给出正确的结果。有趣的是,当测试者上传一张热狗图片时,它的唯一的输出结果就是上传的那张热狗图片,这说明该项技术离完全成熟还有很长一段路要走。

 

目前该系统识别的正确率只有 65% 左右,其所遇到的最大瓶颈还在于图片本身。联合研发人 Nick Hynes 表示,人们在拍摄食物照片的时候,食物的呈现会受到拍摄状态的影响,包括角度、远近、摆放和灯光等因素都可能造成识别结果的不同。在同一种食物出现在不同的菜谱中时,系统的识别错误率也会提升。目前该系统比较擅长于识别烘焙制的食物。

 

不过,MIT 研发的这项技术如果成熟了,就可以运用到万亿级的食品市场中,它应用的想象空间将会非常之大,我们现在只能期待着它的不断完善。


-End-


参考:http://news.mit.edu/2017/artificial-intelligence-suggests-recipes-based-on-food-photos-0720