岁序更替,华章日新。在刚刚过去的 2023 年中,AI for Science 带来了太多惊喜,也埋下了更具想象空间的种子。
从 2020 年开始,以 AlphaFold 为代表的科研项目将 AI for Science 推向了 AI 应用的主舞台。两年来,从生物医药到天文气象、再到材料化学等基础学科,都成为了 AI 的新战场。在这个过程中,AI 的能力也具象化为一柄利刃,甚至可以劈开困扰人们半个世纪的桎梏,大大加速了科研进程。
珠玉在前,进入 2023 年后,AI 在科研领域的征程也更加顺畅,越来越多的研究团队开始寻求 AI 的帮助,从而催生了更多的高价值成果。
作为最早一批关注到 AI for Science 的社区,「HyperAI超神经」通过解读前沿论文的方式持续记录其最新进展,一方面是将最新的成果、研究方法进行普适化分享,另一方面也是希望能够令更多团队看到 AI 对于科研的帮助,为 AI for Science 在国内的发展贡献力量。
岁末年初,正是观往知来的好时节,我们将「HyperAI超神经」在 2023 年解读的前沿论文进行了分类汇总,方便不同科研领域的读者检索。
关注公众号,在后台回复「2023 ScienceAI」即可打包下载全部论文。另外,部分论文中所使用的数据集可以在「HyperAI超神经」官网下载获取。
下载地址:
https://hyper.ai/datasets
机器学习模型准确预测长效注射剂药物释放速率,加速长效注射剂研发
Machine learning models to accelerate the design of polymeric long-acting injectables
机器学习算法有效预测植物抗疟性,准确率为 0.67
Machine learning enhances prediction of plants as potential sources of antimalarials
基于活细胞明场动态图像和机器学习的分化系统,实时调节和优化多能干细胞分化过程
A live-cell image-based machine learning strategy for reducing variability in PSC differentiation systems
将机器学习模型应用于预测生物墨水可打印性,提高预测率
Predicting pharmaceutical inkjet printing outcomes using machine learning
利用深度学习筛选约 7,500 个分子,找出了抑制鲍曼不动杆菌的新型抗生素
Deep learning-guided discovery of an antibiotic targeting Acinetobacter baumannii
利用机器学习发现三种 Senolytics,并验证其在人类细胞系中的抗衰作用
Discovery of Senolytics using machine learning
借助机器学习,对多巴胺的释放量和释放位置进行量化分析
Identifying Neural Signatures of Dopamine Signaling with Machine Learning
利用图神经网络,从数十万种化合物中筛选出了安全高效的抗衰老成分
Discovering small-molecule senolytics with deep neural networks
DeepMind 利用无监督学习开发 AlphaMissense,预测 7100 万种基因突变
Accurate proteome-wide missense variant effect prediction with AlphaMissense
基于 Transformer 的回归网络,结合 CGMD,对百亿种多肽的自组装特性进行了预测
Deep Learning Empowers the Discovery of Self-Assembling Peptides with Over 10 Trillion Sequences
基于 Transformer 开发 Macformer,成功将无环药物菲卓替尼大环化,为药物开发提供了新方法。
Macrocyclization of linear molecules by deep learning to facilitate macrocyclic drug candidates discovery
A principal odor map unifies diverse tasks in olfactory perception
开发 GPCRs-G 蛋白选择性的算法,研究选择性的结构基础
Rules and mechanisms governing G protein coupling selectivity of GPCRs
快速自动扫描套件 FAST 允许 AI 自动识别扫描位置,高效精准的获取样本信息
Demonstration of an AI-driven workflow for autonomous high-resolution scanning microscopy
Machine learning‑based predictive models for the occurrence of behavioral and psychological symptoms of dementia: model development and validation
基于机器学习,利用特征选择策略,得到了一组乳腺癌特定诊断生物标志物
Robust Feature Selection strategy detects a panel of microRNAs as putative diagnostic biomarkers in Breast Cancer
对比逻辑回归模型和 3 种机器学习模型,成功预测中国老年冠心病合并糖尿病或糖耐量受损患者一年内死亡率
Machine learning-based models to predict one-year mortality among Chinese older patients with coronary artery disease combined with impaired glucose tolerance or diabetes mellitus
利用 AI 开发出新脑机技术,让失语 18 年的中风患者重新「开口说话」
A high-performance neuroprosthesis for speech decoding and avatar control
商用 AI Lunit 阅读乳腺 X 光片的准确率与医生相当
Performance of a Breast Cancer Detection AI Algorithm Using the Personal Performance in Mammographic Screening Scheme
Self-supervised learning of hologram reconstruction using physics consistency
视网膜图像基础模型 RETFound,预测多种系统性疾病
A foundation model for generalizable disease detection from retinal images
Large-scale pancreatic cancer detection via non-contrast CT and deep learning
优化摩擦电纳米发电机触觉传感器的设计,进行文字识别和盲文识别
Machine Learning-Enabled Tactile Sensor Design for Dynamic Touch Decoding
结合多种深度学习架构,通过表面观察确定材料的内部结构
Fill in the Blank: Transferrable Deep Learning Approaches to Recover Missing Physical Field Information
Enhancing corrosion-resistant alloy design through natural language processing and deep learning
基于机器学习模型,训练 AI 提取多孔材料结构参数以预测水吸附等温线
Machine learning-assisted prediction of water adsorption isotherms and cooling performance
场诱导递归嵌入原子神经网络 FIREANN,准确描述外场强度和方向变化
Universal machine learning for the response of atomistic systems to external fields
DeepMind 发布深度学习工具 GNoME,发现 220 万种新晶体
Scaling deep learning for materials discovery
Material symmetry recognition and property prediction accomplished by crystal capsule representation
RetroExplainer 算法基于深度学习进行逆合成预测
Retrosynthesis prediction with an interpretable deep-learning framework based on molecular assembly tasks
利用机器学习优化 BiVO(4) 光阳极的助催化剂
A comprehensive machine learning strategy for designing high-performance photoanode catalysts
基于机器学习的群体遗传方法,揭示葡萄风味的形成机制
Adaptive and maladaptive introgression in grapevine domestication
*来源:Proceedings of the National Academy of Sciences
*作者:中国农业科学院深圳农业基因组的研究人员
*解读:葡萄风味有奥秘,农科院用机器学习揭示基因渐渗过程(点击阅读原文)
*论文:
https://www.pnas.org/doi/abs/10.1073/pnas.2222041120
利用 Python API 与计算机视觉 API,监测日本的樱花开放情况
The spatiotemporal signature of cherry blossom flowering across Japan revealed via analysis of social network site images
综述:借助 AI 更高效地开启生物信息学研究
除了类似 AlphaFold 这一类广为人知的生物信息学进展外,AI 在同源搜索、多重比对及系统发育构建、基因组序列分析、基因发现等生物学领域中,都有丰富的应用案例。作为一名生物学研究人员,能熟练地将机器学习工具,整合到数据分析中,必将加速科学发现、提升科研效率。
*推荐阅读:生物信息学 | 借助 AI 更高效地开启研究(点击阅读原文)
Uncovering developmental time and tempo using deep learning
利用 5 万多张照片,训练基于人脸识别 ArcFace Classification Head 的多物种图像识别模型
A deep learning approach to photo–identification demonstrates high performance on two dozen cetacean species
利用 628 只拉布拉多猎犬数据,对比 3 种模型,发现了影响嗅觉检测犬表现的行为特性
Machine learning prediction and classification of behavioral selection in a canine olfactory detection program
Accurate proteome-wide missense variant effect prediction with AlphaMissense
BirdFlow 模型利用计算机建模和 eBird 数据集,准确预测候鸟的飞行路径
BirdFlow: Learning seasonal bird movements from eBird data
利用计算机视觉+深度学习开发奶牛跛行检测系统,准确度可达 94%-100%
Deep learning pose estimation for multi-cattle lameness detection
Testing early detection of pine processionary moth Thaumetopoea pityocampa nests using UAV-based methods
结合实验室观测与机器学习,证明番茄与烟草植物在胁迫环境下发出的超声波能在空气中传播
Sounds emitted by plants under stress are airborne and informative
通过 YOLOv5 算法,设计监测母猪姿势与猪仔出生的模型
Sow Farrowing Early Warning and Supervision for Embedded Board Implementations
Deep Learning Enables Instant and Versatile Estimation of Rice Yield Using Ground-Based RGB Images
利用无人机采集植物表型数据的系统化流程,预测最佳采收日期
Drone-Based Harvest Data Prediction Can Reduce On-Farm Food Loss and Improve Farmer Income
基于随机森林的机器学习模型 CSU-MLP,对中期(4-8天)范围内恶劣天气进行准确预报
A new paradigm for medium-range severe weather forecasts: probabilistic random forest-based predictions
利用全球风暴解析模拟与机器学习,创建新算法,准确预测极端降水
Implicit learning of convective organization explains precipitation stochasticity
综述:从雹暴中心收集数据,利用大模型预测极端天气
早在 2021 年,阿里云就透露称,达摩院与国家气象中心联合研发了 AI 算法用于天气预测,并成功预测了多次强对流天气。同年 9 月,Deepmind 在《Nature》上发表文章,利用深度生成模型进行降雨量的实时预报。
2023 年年初,Deepmind 正式推出了 GraphCast,可以在一分钟内对全球未来 10 天的气象,进行分辨率为 0.25° 的预测。4 月,南京信息工程大学和上海人工智能实验室合作研发了「风乌」气象预测大模型,误差较 GraphCast 进一步降低。
随后,华为推出了「盘古」气象大模型。由于模型中引出了三维神经网络,「盘古」的预测准确率首次超过了目前最准确的 NWP 预测系统。近期,清华大学和复旦大学相继发布了「NowCastNet」和「伏羲」模型。
*推荐阅读:雹暴中心收集数据、大模型加持极端天气预测,「追风者也」正在上演(点击阅读原文)
综述:数据驱动的机器学习天气预报模型
数值天气预报是天气预报的主流方法。它通过数值积分,对地球系统的状态进行逐网格的求解,是一个演绎推理的过程。2022 年以来,天气预报领域的机器学习模型取得了一系列突破,部分成果可以与欧洲中期天气预报中心的高精度预测匹敌。
*推荐阅读:机器学习 vs. 数值天气预报,AI 如何改变现有的天气预报模式(点击阅读原文)
利用模拟数据训练计算机视觉算法,对天文图像进行锐化「还原」
Galaxy image deconvolution for weak gravitational lensing with unrolled plug-and-play ADMM
PRIMO 算法学习黑洞周围的光线传播规律,重建出更清晰的黑洞图像
The Image of the M87 Black Hole Reconstructed with PRIMO
利用无监督机器学习算法 Astronomaly ,找到了之前为人忽视的异常现象
Astronomaly at Scale: Searching for Anomalies Amongst 4 Million Galaxies
Predicting new mineral occurrences and planetary analog environments via mineral association analysis
利用物理模型和机器学习模型,预测干旱气候下光伏板表面的污垢和其他物质的累积造成的污染损失
Characterizing soiling losses for photovoltaic systems in dry climates: A case study in Cyprus
通过机器学习方法,预测碳捕捉过程中胺类有害气体的排放量
Machine learning for industrial processes: Forecasting amine emissions from a carbon capture plant
Landslide susceptibility modeling by interpretable neural network
利用可解释性 AI ,分析澳大利亚吉普斯兰市的不同地理因素,得到了当地的野火发生概率分布图
Explainable artificial intelligence (XAI) for interpreting the contributing factors feed into the wildfire susceptibility prediction model
AI 在超光学中的正问题及逆问题、基于超表面系统的数据分析
Artificial Intelligence in Meta-optics
*来源:ACS Publications
*作者:香港城市大学的研究人员
*解读:AI 加码,超光学进入狂飙时代(点击阅读原文)
*论文:
https://pubs.acs.org/doi/10.1021/acs.chemrev.2c00012
Ithaca 协助金石学家进行文本修复、时间归因和地域归因的工作
Restoring and attributing ancient texts using deep neural networks
30 位学者合力发表 Nature 综述,10 年回顾解构 AI 如何重塑科研范式
来自斯坦福大学计算机科学与基因技术学院的博士后 Hanchen Wang,与佐治亚理工学院计算科学与工程专业的 Tianfan Fu,以及康奈尔大学计算机系的 Yuanqi Du 等 30 人,回顾了过去十年间,基础科研领域中的 AI 角色,并提出了仍然存在的挑战和不足。
*推荐阅读:30 位学者合力发表 Nature 综述,10 年回顾解构 AI 如何重塑科研范式(点击阅读原文)
政策:科技部会同自然科学基金委启动「人工智能驱动的科学研究」( AI for Science )专项部署工作
3 月 27 日,据新华社报道,为贯彻落实国家《新一代人工智能发展规划》,科技部会同自然科学基金委近期启动「人工智能驱动的科学研究」( AI for Science )专项部署工作。
本次,我国布局 AI for Science 前沿科技研发体系,将紧密结合数学、物理、化学、天文等基础学科关键问题,围绕药物研发、基因研究、生物育种、新材料研发等重点领域科研需求展开。对此,中科院自动化研究所所长徐波解释说,新药创制、基因研究、生物育种、新材料研发等领域,是人工智能与科学研究结合需求迫切、进展突出、具有代表性的重要方向。
*推荐阅读:Science AI 大潮已至,科技部亲自下场出大动作(点击阅读原文)
以上就是「HyperAI超神经」在 2023 年为大家解读的前沿论文,关注公众号,并在后台回复「2023 ScienceAI」即可打包下载全部论文。
2024 年,我们将继续关注 AI for Science 的最新科研成果及相关应用,敬请期待~