专栏名称: 雷峰网
中国智能硬件第一媒体
目录
相关文章推荐
51好读  ›  专栏  ›  雷峰网

IBM人工智能“沃森”首次确诊罕见白血病, 只用了10分钟!

雷峰网  · 公众号  · 科技媒体  · 2016-08-08 17:21

正文


10分钟能做什么?充其量只能用来看几条新闻的时间,对于Wats on而言却能诊断一名病人。


Watson的认知计算能力已经为我们所熟悉,而它也在医学领域不断发力。日前,东京大学医学研究院利用Watson判断一位女性患有罕见的白血病,而这只用了10分钟的时间。


患者为一名60岁的女性,最初根据诊断结果,显示她患了急髓白血病。但在经历各种疗法后,效果并不明显。 根据东大医学院研究人员Arinobu Tojo的说法,他们利用Watson系统来对此病人进行诊断。系统通过比对2000万份癌症研究论文,在10分钟得出了诊断结果:患者得了一种罕见白血病。


该研究主要由美国的IBM研究所,纽约基因组中心及东大医学研究所联合完成。


hsnewsbeat


| 10分钟诊断是如何实现的?


东京系统与软件开发研究所Watson Health Cloud的软件工程师林雪婷向雷锋网表示,目前医疗方面的项目难点其实比较统一。


  • 首先,你要有可以对照的数据,在这个项目里是和纽约基因中心进行合作。

  • 其次数据使用时,第三方只能根据HIPPA协议使用个人数据的统计信息;

  • 再者,可能就是怎么把数据导出来作为这个研究的样本了,这个也很麻烦,因为基因数据很大。


而做人工智能诊断智能图谱的康夫子CEO,前百度自然语言处理部资深研发工程师、文本知识挖掘方向负责人张超也列举了这一研究的主要难点。“数据抽取是个非常有门槛的技术”,主要体现在四个方面:


1. 相比较结构化或者半结构化抽取,无结构化抽取面临更多的挑战,比如:抽取模板学习更为复杂,抽取过程的语义转移,另外还有不少歧义、边界问题需要处理;

2. 无结构化抽取的面对的数据源更为繁杂,如:网页、论文、书籍、问答数据等等,不同数据源带来的数据清洗工作也不尽相同;

3. 在医学应用场景下,要求抽取工作的准确率、召回率都需要很高,这也是抽取任务的一大挑战;

4. 无结构化文本抽取的过程也伴随着大量的计算,对计算性能也有较高的要求。


而新闻中提到的“10分钟”,在林雪婷看来,“应该是不包括把数据导出来的时间的”。







请到「今天看啥」查看全文