以0到1的分数计算,获胜算法在预测一种分子的好闻程度时达到0.71分,浓烈程度达到0.78分,预测另外19种指标时得到了0.1到0.7分,这些指标包括大蒜味、鱼腥味、水果味、酸味、麝香味、腐臭味、汗味、甜味、青草味和烧焦味。团队成员写道:“我们几乎可以预测任何分子的知觉性质,并以此推测出一种分子的气息,我们的预测是相当精确的。”
这些算法的得分似乎并不算高,但它们已经超越了之前的各项研究了。贝茨学院的杰森•卡斯特罗(Jason Castro)指出:“他们在相关性方面并没有多少突破,不过我自己也做过这方面的研究,我知道这样的结果已经很了不起了。”
他还说,
人类的鼻子同样是不完善的
。“如果我给你一种化学物质,让你在周二闻一次,周三再闻一次,你两次的知觉就会发生变化。而这些算法和人类的固有变化已经很接近了。”除此之外,不同的个体之间也有差异。同样一种分子,你和我可能闻出不同的气味,这就是为什么梦想挑战赛中的算法在预测分子的平均气味时表现出色,而预测它们对于特定被试的气味时就不那么准确了。
成功的虚拟鼻子有赖于志愿者的鼻子——他们需要在一排排玻璃瓶间闻味、打分。这份工作看似枯燥,但实际神秘又性感。图片来源:123rf.com.cn正版图片库
按照伏肖尔的说法,这已经是一种进步,但“我们还没有解决问题”。
目前还没有一个完善的理论能在一种分子的性质和它的气味之间建立对应
。如前文所说,一种分子的气味可能取决于它的碳原子数目、它的稳定程度以及它的支链。算法隐约揭示了某些特征和某些性质之间的关系:硫原子使物体较易发出烧焦味或大蒜味,大分子较易发出好闻的气味,香草醛一类的分子闻起来较像烘焙食品。
“我们还没能在特征甲和知觉性质乙之间找到严格的对应。”卡斯特罗说,“不同的分子,彼此可能会有许多差异。”
机器学习也许有助于处理这种复杂性,因为机器识别重要特征的速度要远远超过任何人类,但前提是你有一组优秀的数据。而说到数据,即使是伏肖尔和凯勒的巨量数据也只是一个开端。他们现在想招募更多志愿者、测试范围更广的气味。他们还想让被试判断气味的相似性——如果给你一种分子,你觉得它闻起来和其他十种分子有多少相似?
这意味着他们要招募许多志愿者,让他们一天天地伏在一架架玻璃瓶上闻味——这多少是一项吃力不讨好的任务,但奇怪的是,人们对它的兴趣却偏偏很大。在他们的第一项研究中,“那些志愿者都显得努力而专注,每个人都在实验中投入了20个小时,最后我们不得不把他们劝走”。伏肖尔说:“嗅觉研究有着一种非常诱人的魅力。气味使人联想到性爱、香水和食物。气味是很撩人的。”