大数据文摘出品
作者:牛婉杨
全球抗疫进行中。除了医务人员们争分夺秒,全球数据科学家和人工智能专家们也联合了起来,希望通过数据分析和技术的力量争取更多时间。
3月17日,COVID-19开放研究数据集(CORD-19)宣布免费发布,并基于这一数据集,在Kaggle举办了“COVID-19开放研究数据集挑战赛”。
这一开放数据集囊括了世界各地29,000多篇关于冠状病毒家族的学术论文的储存库,是微软研究院、艾伦人工智能研究所、美国国立卫生研究院(NIH)的国家医学图书馆、白宫科学技术办公室(OSTP)以及其他机构的工作成果。它包括了来自13,000多篇学术文章的机器可读研究,目的是授权医学和机器学习研究社区挖掘文本数据,以获得有助于对抗COVID-19的真知灼见。
本次Kaggle挑战赛为每个任务提供1000美元的奖金,奖励那些提交的内容符合评估标准的优胜者。得奖者可选择以慈善捐款或金钱形式领取此奖项,以协助COVID-19的赈灾/研究工作。
Kaggle挑战赛:
https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
微软,白宫和艾伦研究所为医学和NLP研究人员发布冠状病毒数据集
这次的数据开放是疫情爆发以来,美国政府牵头在数据分析领域的重要进展。白宫首席技术官Michael Kratsios昨天在电话会议上说,“白宫与美国国家科学院、工程院、医学院和世界卫生组织合作,确定了几十个与COVID-19相关的高优先级科学问题,以号召采取相应的行动,人工智能可以有效帮助科学家总结和分析信息。”
数据的收集敦促AI研究人员创建数据和文本挖掘技术来协助医学研究人员。加强科学专业人员之间的数据共享和协作肯定可以在抗击COVID-19方面发挥作用。
微软首席科学官Eric Horvitz在接受采访时表示,“我们创建开放数据集和针对冠状病毒的Kaggle挑战赛的目的是激发AI社区创建可帮助科学家掌握数千篇文章的工具,使他们能够开发出解决COVID-19的方法。整个生物医学领域每年都有100万篇新论文发表,人工智能作为科学家的关键辅助技能也将变得越来越重要。”
目前,多个组织正在使用NLP来对抗COVID-19。哈佛医学院开发了一种工具来查看相关数据,如患者记录、社交媒体和公共卫生数据。据报道,使用NLP等工具来搜索新闻文章、公共卫生数据和其他来源的BlueDot公司在世界卫生组织(World health Organization)发出警报之前就发现了COVID-19的爆发。在中国,像阿里巴巴达摩院这样的科技巨头正在应用最先进的NLP技术,对医疗记录进行文本分析,并由中国疾控中心的官员进行流行病学调查。
像PubMed和微软的学术图这样的网站,现在有供医学研究人员浏览的COVID-19资源页面。与arXiv.org和medrxiv.org等已出版文献和预印本资料库的合作将有助于保持数据的更新。Chan Zuckerberg Initiative和Georgetown University的安全与新兴技术中心也同意贡献知识。白宫副首席技术官Lynne Parker表示,在过去的一周里,双方的共同努力已经取得了进展,Kaggle网站将列出最迫切需要解决的问题。
作为为期五年的合作计划的一部分,哈佛医学院和广州研究院将分享中国恒大集团提供的1.15亿美元研究资金。广州研究所的工作将由钟南山领导,他目前是中国2019n-CoV专家组组长,也是中国呼吸疾病国家重点实验室主任。
用于对抗COVID-19的其他形式的AI包括为机器人消毒、通过深度学习来预测死亡率,以及通过CT扫描图像检测COVID-19。世界各国政府也开始使用GPS跟踪、自动筛选应用程序、文本提醒和智能手机运动跟踪等技术。其他正在进行的项目包括Abcellera和DARPA的大流行预防平台项目之间的抗体发现项目,以及旨在在60天内阻止疾病暴发的自动诊断,以使预防和治疗(ADEPT)成为可能。
阿里巴巴王桢博士
强化学习免费系列公开课
17、18、19每晚7点连讲三天!
纯干货分享!
扫码进入今日直播间