专栏名称: 天翼智库
天翼智库是中国电信研究院战略发展研究所承办的面向公众的智库研究信息发布平台,为您提供最新信息通信行业发展动态、政策观察、产业分析和战略洞察等。
目录
相关文章推荐
小张聊科研  ·  国自然马上提交了,你的实验设计严谨吗? ·  20 小时前  
51好读  ›  专栏  ›  天翼智库

AI+医药:下一个黄金赛道

天翼智库  · 公众号  ·  · 2024-05-25 00:27

正文

在3月19日的英伟达GTC大会上,有90场活动与健康/生命科学相关,活动数目位居全行业第一。云集了一众巨鳄,包括投资大佬木头姐(女巴菲特),强生、GSK、默克、诺华、诺和诺德、基因泰克、安斯泰来等医药巨头高级专家,以及各AI制药公司创始人。英伟达医疗保健副总裁甚至预言计算机辅助药物发现行业将会打造出市值万亿美元的药物公司。

巨大的医药市场及研发投入

根据弗若斯特沙利文公司(Frost&Sullivan)的数据,全球生物医药市场规模2016—2022年年均复合增长率为3.9%,保持稳定增长态势, 预期2024年全球生物医药市场收入将达到1.71万亿美元。 2022年,我国生物医药市场规模突破4万亿元人民币,同比增长7.10%,增速是国际市场的两倍, 2024年我国市场规模将达4.6万亿元人民币。

全球生物医药研发投入在2020年首次超过2000亿美元,2021年达到2241亿美元。预计后续研发投入将继续保持稳健的增长态势,年均复合增长率为7.6%, 到2024年预计可达3000亿美元。我国同期年均复合增长率接近20%,2024年预计达到493亿美元。 根据Global Market Insights报告, AI药物研发市场将保持快速增长,预计年均复合增速超过29%,2032年将超过205亿美元, AI+医药研发具有较大市场潜力。

医药研发领域的数据和算法蓬勃发展,使得AI大规模进入药物研发成为现实

传统的药物研发主要包含药物发现、临床前研究、临床试验和上市销售环节,伴随着药物研发数据的高速累积和数字化转型,以及人工智能技术的加速发展,AI在新药发现环节应用日益增多,优势也得到突出体现。 医药研发领域的数据和算法蓬勃发展,使得AI大规模进入药物研发领域成为现实。

在数据集方面,ChEMBL数据库 拥有超过200万个表现出药物特性的化合物,ChemDB数据库包含近500万个市售小分子及其理化性质, DGIdb数据库 包含超过40,000个基因和10000种药物, DrugBank数据库 包含14746种药物以及药物-药物相互作用、药物-靶标相关性、药物分类和药物反应的全面信息。此外还有 副作用资源(SIDER)数据库、医药巨头私有数据库(如辉瑞的分子库) 等等。 这些数据库为AI药物研发提供了高质量的数据集。

算法建模方面,药物发现领域已经开发了两种先进的AI技术,即监督和无监督学习。 监督学习技术是使用输入标记的数据来训练能够对新数据的结果进行分类或预测的模型。无监督学习技术处理未标记的数据,旨在开发能够在没有先验知识的情况下识别重复模式和输入数据聚类的模型。

AI在药物研发领域的应用范围广泛,大幅度缩减时间和费用

医药巨头诺和诺德首席执行官在接受采访时表示:“生成式AI有可能在未来几年彻底改变我们在生命科学领域进行复杂科学研究的方式。”他预测 AI可以将早期新药发现工作从通常需要三到四年缩短到一年。

大幅度缩短靶点发现时间,加快药物研发进程。 药物研发过程的首要步骤是选择药物作用的靶点蛋白。传统靶点发现通过人工阅读科研文献,收集分析流行病学数据,结合个人经验去推测潜在的药物靶点,通常耗时2-3年,而AI利用自然语言处理技术,可以高效率挖掘文献、组学数据、功能实验数据等海量医学资料,在短时间内发现药物和疾病之间的作用关系,从而得到药物在机体细胞上产生效用的候选靶点,这大幅缩短了靶点发现的时间,加快了药物研发的进程。

AI辅助化合物发现与设计,大幅缩短研发周期降低研发费用。 可对高通量筛选过程大幅度优化,直观地定性推测物质的结构和活性的关系,从而推测出活性位点的结构和设计新的活性物质结构,大幅缩短研发周期,降低研发费用。

AI有助于发现生物学规律,免去了动力学模拟所需的高昂成本。 人体中的蛋白质管理着各种功能,每个蛋白质由一系列氨基酸组成。能够根据其氨基酸序列预测蛋白质形状非常重要,因为可以利用这些预测来设计新药。这正是深度学习的用武之地:在数以亿计的不同蛋白质序列及其底层结构上训练人工智能模型,让这些模型发现生物学规律,无需真正分子动力学模拟所需的昂贵计算。

运营商数字化转型实施策略

国际AI巨头们都对医药领域抱有强烈兴趣。 截至2023年11月,英伟达已“扫货”9家AI制药公司。此外,还与包括罗氏、阿斯利康、安进等在内的多家跨国药企达成了AI制药合作。微软、谷歌、亚马逊、Salesforce等也正在将生物技术视为AI的下一个前沿领域。例如谷歌DeepMind的研究人员们将DeepMind模型(一种预测蛋白质结构的突破性工具)用于开发一种“分子”注射器,以将药物直接注射到细胞中;Salesforce去年推出了蛋白质生成模型ProGen;微软也发布了类似的开源模型EvoDiff;亚马逊为其AWS机器学习平台SageMaker发布了蛋白质折叠工具。

谷歌DeepMind的成功案例: 2022年, DeepMind通过AlphaFold2模型, 预测了2.2亿种蛋白质结构,覆盖DNA数据库几乎所有已知生物体的蛋白质, 解决了长期困扰生物医学研究领域的难题, 为加速生物医学研究打开了大门。2023年9月, DeepMind首席执行官Demis Hassabis以及该公司科研人员John Jumper,因AlphaFold获得了有“诺奖风向标”之称的拉斯克基础医学奖。

我国“AI+医药”起步较晚,但发展迅速。 国内从2018年到现在已经成立了超过百家的AI制药公司,阿里、百度、腾讯等头部互联网企业均设立了医疗(含医药)AI部门。百度文心一言首个应用落地医药行业,AI在医药领域的应用不断深入。

我国成功案例: 英矽智能通过AI研发设计的肺部纤维化疾病INS018_055登上Nature子刊,如果按传统方法,需耗费6年时间和4亿多美元,但现在时间缩短了一半,而成本仅为原来的1/3。

对运营商的启示

我国运营商均拥有庞大的算力资源,并在大模型领域积极投入,在行业拓展方面设立了卫健专业运营实体。建议运营商充分利用自身优势,多维度切入AI药物研发行业:

为AI药企提供高通量无损网络和算力资源: AI医药研发需要基于物理学、化学、医学、生理学等跨学科进行建模,产生的数据量较大,利用的算力也较大,因此AI药企迫切需要更好地利用云网服务部署灵活算力和搭建数据架构。运营商可以利用其优质的网络、强大的算力,为AI药企提供稳定、高效的基础设施支持,包括建设高性能计算中心、数据存储中心以及高通量无损网络平台。

协助AI药企整合数据资源: 数据是AI药企的核心资产。就目前的情况来看,公开数据占比约为80%-90%,但各家药企还有自己私有的数据。运营商可以利用可信云以及国字头的背书,在政府支持下,将产投研的药企、医院、机构联合起来,通过合作将本地化的经验和数据进行隔离分享,建立安全可靠的数据库,为AI医药研发提供数据支持。

深入了解医企需求和痛点,提供定制化AI解决方案:







请到「今天看啥」查看全文