韩亦舜,现任清华大学清华-青岛数据科学研究院执行副院长。早年就读于清华大学应用数学专业和经济管理专业,1986年赴美,求学工作多年。回国后投身企业经营管理事业,涉足高科技和传统等多个产业。拥有企业经营和实体产业多层次的工作经历。
近日,“清华大学人工智能与未来医学影像高峰论坛”在清华大学召开,清华大学清华-青岛数据科学研究院执行副院长韩亦舜以《医疗数据开放共享规范探讨》为题发表了演讲,本文对其精彩内容进行了整编。
韩亦舜
以下为韩院长演讲实录:
我参加过很多医学大数据相关话题的论坛,有这样的感觉,我们这么多人关心医疗健康大数据,如果我们共同推动的话,中国的医疗健康大数据能够走得更远更好。但是现实中我们会遇到一些问题,其中最大的顾虑就是涉及到如何处理数据共享时的安全、隐私等问题。
健康医疗大数据的发展急需开放共享的规范。我今天想要跟大家分享一下清华大学准备成立的医疗数据伦理工作组的一些思考,为这些基础工作打一个好的底子。
首先,我们的司法实践要向科技创新倾斜。中国的司法实践是不是真的能够包容创新所犯的非恶的错误。
这个应该向国外学习。前不久特斯拉的车出事故了,最后还是庭外和解,而不是狠狠的咬特斯拉,这也能够说明为什么美国创新比较活跃,因为他们在司法实践中对创新比较包容。
其次,我们需要要建立一套医疗数据隐私的标准。我们一直觉得数据共享不安全,会侵犯患者隐私,但是医疗数据隐私的标准是什么,中国迟迟没有这样的标准。
我们需要要建立一套规范。有些医学界的顾虑是担心技术问题,我们提倡把技术问题交给技术人员解决,比如数据格式不标准,这些问题有可能解决,当然是在医学界人士的支持下。
最后我们提倡:从自上而下和自下而上两个方向上努力。现在国家层面、各个省市层面建立大型医疗健康数据平台、医疗云等等。这些大部分情况都是自上而下的,但是我希望能够推动一些自下而上的工作,调动医生、科主任和医院的积极性,让医疗的工作者真正能够从数据挖掘中获益,体现出数据开放共享的价值。
我们认为在保护医护隐私,保护患者隐私的前提下,应大力支持并推进第三方科研机构使用医疗健康数据。
为什么专门提出来医护隐私?大家知道中国医患关系有点紧张,如果不对医生、医院进行保护,就会出问题。我们对隐私的界定基本上是基于科研教学的目的,我们希望清华大学今后的工作能够参照这个标准。
具体的规范我列了五个方面:脱敏规范、安全规范,要有公信,要有追溯的规范和责任的规范,这个规范不一定完整,我是抛砖引玉希望引起大家的讨论。
大家都知道脱敏就是所谓的数据去隐私化。我在后面试图指出哪些隐私数据应该脱敏。脱敏技术手段日趋成熟,加之脱敏的理念,可以在保护数据隐私方面有很大进步。
安全方面:从储存安全到传输安全再到使用安全,我们都要提出一些自己的思考,也需要有相应的技术做支撑。
公信规范:我们在信息公开和数据质量等方面提出了设想,相信这样有助于提高公信力,当然前提是数据质量要有保障。
追溯性:我们要做的符合国际标准的多中心研究,数据最终要有可追溯性,前不久中国爆出来很多科研方面的问题,被一些杂志给屏蔽了。实际上是因为这个基础不好,使得很多人难以发挥。建立数据追溯的意识很重要。
责任规范:除了定义隐私以外,我们很希望落实责任。前面大家听到隐私泄露的问题,国家定了隐私泄露就要判刑,弄得我们很多医院医生想推动多中心数据共享都做不了。
但事实上我觉得这个事要分清楚责任。如果我们界定离开医院的数据都是脱敏的,即便是数据汇聚以后被黑客攻击而流传出去也不大会涉及个人隐私泄露。会大大降低泄露隐私的风险。
审计制度:发现问题解决问题,而不是笼统的说有一个硬性的帽子给大家戴上。要有数据审计制度加以保证。
隐私问题:我们做了这样的思考,首先患者隐私分成三类。
第一类信息是与医疗与疾病没关系的,完全可以屏蔽掉,以减少对患者可能造成的骚扰。比如:患者姓名,电话号码等,这些和对疾病的研究没有关系的数据,就要防止它们离开医院。
第二类跟流行病学有关的信息,我们认为应该有加密处理的规范,让它既能够用于科研呈现出价值,对一些话题的讨论追踪研究,又能够保护隐私。
第三类也是借鉴美国的健康信息保护规范,把人体内或辅助人能力的一些设备列入个人隐私信息,比如身体装了一些微型给药泵,如果数据泄露了,就可能造成生命安全潜在风险。这个也是一类要保护的信息数据。
为什么放在第三类?是因为这种研究多数都会是某一个药商或器械商委托我们做的,要研究某个产品,这些数据可能与用药药效和设备的可靠性相关,希望在加密保护的前提下加以使用。
除了要保护患者隐私,医者的隐私也应该保护。比如医生的基本信息,家庭情况,这些与医生职业无关的信息我们尽量保护,减少不法分子对医护人员的骚扰。
借鉴患者隐私信息,医护人员的隐私信息分为两类。对于以医护人员作为研究对象的数据挖掘时,对相关数据要做加密。我们提出来要对医护的职业信息加以保护,为的是让大家减少顾虑,真正把有用的信息拿出来做科研挖掘。
我有一个梦想,我希望能够建设符合国际医学研究标准的多中心的科研数据平台,建立中国的单一病种数据库。我相信如果这个符合国际标准的建设起来,未来有一天会让全世界的医学大佬,全世界的科学家为我们中国的患者贡献他们的智慧。
清华大学未来医学影像高峰论坛是由清华大学医学院、清华大学清华-青岛数据科学研究院主办,清华大学医学院未来医学影像实验室承办,汇聚人工智能领域的知名学者、顶级医院临床科学家、数据科学领域专家、医学影像技术领域翘楚共同探讨医学影像、人工智能与大数据等技术在临床医学研究中的热点问题和未来发展方向。
论坛中,清华大学医学院未来医学影像实验室启动“AI+MI”项目,联合顶尖临床医院,整合医学影像资源建立数据库,结合清华大学深厚的人工智能算法、高性能计算、大规模存储的工程资源,建立心脑血管疾病、神经退行性疾病和呼吸系统疾病的基于人工智能的医学影像研究,期待更多合作伙伴的加入。
公众号底部菜单有惊喜哦!
企业,个人加入组织请查看“联合会”
往期精彩内容请查看“号内搜”
加入志愿者或联系我们请查看“关于我们”