10分钟能做什么?充其量只能用来看几条新闻的时间,对于Wats
on而言却能诊断一名病人。
Watson的认知计算能力已经为我们所熟悉,而它也在医学领域不断发力。日前,东京大学医学研究院利用Watson判断一位女性患有罕见的白血病,而这只用了10分钟的时间。
患者为一名60岁的女性,最初根据诊断结果,显示她患了急髓白血病。但在经历各种疗法后,效果并不明显。 根据东大医学院研究人员Arinobu Tojo的说法,他们利用Watson系统来对此病人进行诊断。系统通过比对2000万份癌症研究论文,在10分钟得出了诊断结果:患者得了一种罕见白血病。
该研究主要由美国的IBM研究所,纽约基因组中心及东大医学研究所联合完成。
hsnewsbeat
|
10分钟诊断是如何实现的?
东京系统与软件开发研究所Watson Health Cloud的软件工程师林雪婷向雷锋网表示,目前医疗方面的项目难点其实比较统一。
-
首先,你要有可以对照的数据,在这个项目里是和纽约基因中心进行合作。
-
其次数据使用时,第三方只能根据HIPPA协议使用个人数据的统计信息;
-
再者,可能就是怎么把数据导出来作为这个研究的样本了,这个也很麻烦,因为基因数据很大。
而做人工智能诊断智能图谱的康夫子CEO,前百度自然语言处理部资深研发工程师、文本知识挖掘方向负责人张超也列举了这一研究的主要难点。“数据抽取是个非常有门槛的技术”,主要体现在四个方面:
1. 相比较结构化或者半结构化抽取,无结构化抽取面临更多的挑战,比如:抽取模板学习更为复杂,抽取过程的语义转移,另外还有不少歧义、边界问题需要处理;
2. 无结构化抽取的面对的数据源更为繁杂,如:网页、论文、书籍、问答数据等等,不同数据源带来的数据清洗工作也不尽相同;
3. 在医学应用场景下,要求抽取工作的准确率、召回率都需要很高,这也是抽取任务的一大挑战;
4. 无结构化文本抽取的过程也伴随着大量的计算,对计算性能也有较高的要求。
而新闻中提到的“10分钟”,在林雪婷看来,“应该是不包括把数据导出来的时间的”。