今年六月对于 IBM 来说应该是不太走运的一个月,先是股神巴菲特对外透露大举减持IBM股票,减持幅度多达三分之一。紧接着第二天,国际评级机构标普又将IBM的信用评级从AA-下调至A+,理由是 IBM 近年来运营出现了衰退,且转型企稳的周期要比分析师预期的要长,而这已经是继穆迪调降IBM信用评级之后第二家给它“降级”的机构。
而对于IBM最为著名的产品
沃森
而言,近期也出现了许多的负面报道,
包括沃森集团与休斯敦的癌症治疗机构M.D.安德森中心的合作在今年分崩离析;随着 IBM 公司的营业额暴跌,股价一直摇摆不定,商业分析专家们一直质疑沃森到底何时能够为公司创造出真正的商业价值。
多重怨念积累之下,资深技术投资者和风投公司 Social Capital 的创始人 Chamath Palihapitiya 于 5 月份在 CNBC 上甚至直接炮轰:
“沃森就是个笑话。”
Palihapitiya认为,IBM的专长其实只是通过他们强大的营销和市场能力,以及信息不对称,去让消费者为他们并不了解的服务买单。
图 | 风投公司 Social Capital 的创始人Chamath Palihapitiya
不过,IBM对于这一指责也并非无动于衷,他们曾在一份声明反击道:
“沃森并不是一个消费类产品,而是一个真正能为产业服务的人工智能平台。
沃森目前已经被美国及其他五个国家用于医学诊疗领域。我们已经在6种癌症的诊疗方面对沃森进行训练,今年还会增加8种。除了在肿瘤学领域的应用,最顶尖的25家来自生命科学、IoT设备制造、零售与金融服务等领域公司起码有一半在使用沃森提供的服务,这里面就包括GM、H&R Block、SalesForce等公司。
什么样的人才会认为拯救生命、优化客户服务、驱动商业创新都是笑话
?”
图丨M.D.安德森中心
然而,
大部分针对沃森的批评,包括与 M.D.安德森中心的分道扬镳,并非是出于沃森有什么特别的技术缺陷。
相反,
批评针对的恰恰是 IBM 之前对沃森前景过于乐观的声明,关于沃森迄今应该取得的成就云云
。
事实上,在医疗人工智能领域,沃森健康应该仍处于领先地位。
如果说目前沃森还没有取得显著成就,那么最明显的阻碍之一就是它需要特定类型的数据进行“训练”,
这些数据通常要么非常紧缺,要么难以访问
。这不是沃森独有的问题,
这是整个医疗机器学习领域面临的通病
。
尽管数据匮乏影响了沃森的开发速度,但这对 IBM 的竞争对手们的影响更大。这是因为,
获取数据的最佳途径是与大型医疗机构密切合作,但这些机构往往在技术上非常保守。
而众多创业公司,甚至是像苹果和谷歌这样的巨型竞争对手,都很难像 IBM 一样取得大型企业高管和IT经理的信任。
可以这么说,尽管 M.D. 安德森项目遇到了问题,IBM 仍然占据着决定性的优势:
它能为沃森搭建广阔的平台——合作中的医疗中心、卫生管理机构和生命科学公司都将提供未来医学人工智能所需的关键数据。
图丨M.D.安德森中心的白血病医生 Courtney DiNardo 在2013年与病人会诊时使用了IBM的沃森系统
毫无疑问,与M.D.安德森中心分道扬镳,给了努力推广沃森的 IBM 当头一棒。
该中心与 IBM 的合作开始于 2012 年,旨在允许沃森读取一切有关病人症状、基因序列和病理报告的数据,结合医生的病案笔记以及相关期刊文章,帮助医生提供诊断和治疗方法。但很明显,
IBM 和M.D.安德森中心对技术的期望显然过高了。
2013 年,IBM 声称“一个新的计算时代已经降临”,同时向福布斯杂志暗示,沃森“已进入临床试验阶段”,并将在短短几个月内投入使用。
2015 年,华盛顿邮报引用了一位 IBM 沃森经理的话,描述沃森如何忙着建立一个“沟通机器与人的集体智能模型”。华盛顿邮报还说,沃森系统会“和医生一起训练,去做他们做不到的事”。
今年 2 月, 运营M.D.安德森中心的德克萨斯大学宣布关闭与 IBM 的合作项目,为合同上最初价值 240 万美元的项目向 IBM 支付高达
3900 万美元
的赔款。
四年过去了,沃森并没有为那些苦苦期盼的患者带来任何帮助,
M.D.安德森中心也没有对沃森作出具体评价,但问题似乎主要来自于
项目管理和资金分配
的内部斗争。
但这并不意味着 IBM 在沃森的技术开发上没有遇到困难。
事实上,技术上的进展比表面上看起来要更加艰难。
要了解是什么阻碍了研发进程,你必须先理解沃森一类的机器学习系统是如何接受训练的。
沃森能够通过不断调整其内部程序来“学习”,并对特定类型的问题给出最有可能是正确的答案(例如,哪张放射影像上显示了肿瘤)。
正确的答案必须是已知的,这样给出答案后系统就能够得到正确的反馈。系统被“喂养”的训练问题越多,它的命中率就越高,机器学习能够轻松地通过X光影像判定恶性肿瘤。
但是,对于远远超出已知范围的、潜在的突破性谜题,比如检测基因排列和疾病之间的关系,沃森面临着一个“先有鸡还是先有蛋”的问题:
它如何利用未经专家筛选的数据进行训练
?
图丨IBM 于2015年宣布,沃森的诊断能力将因为从 Merge Healthcare 获得的数据而得以大幅提升。
纽约一家癌症中心 Memorial Sloan-Kettering的计算病理学家 Thomas Fuchs 说:“
训练一辆自动驾驶的车,任何人都可以告诉它前面有一棵树或一面路牌,驾驶系统就学会了辨识路障。
但是,在医学的专业领域,这种情况少之又少,只有培训了数十年的专家才能告诉系统什么是正确答案。
”
在机器学习系统的每一个领域,都会出现这类绊脚石的翻版。