基于机器学习的分子动力学
第一部分(分子动力学基础)
理论内容
1. 科学研究的四范式:从大数据时代到AI4SCIENCE时代
2. AI4SCIENCE时代的分子动力学模拟:从传统的经验力场方法和第一性原理方法到机器学习力场
3. 基于机器学习的分子动力学的背景,特点和文献进展,及与传统方法的区别.
4. 机器学习与深度学习的快速入门
5. 机器学习的发展历史
6. 通过可视化案例,理解神经网络的通用近似理论
7. 神经元,反向梯度下降,损失函数,过/欠拟合,残差连接等基本概念
8. ANN, CNN, RNN, TRANSFORMER等深度神经网络的基本框架的介绍与特点
9. 机器学习力场的大概流程与使用经验
实操内容
1. Linux系统与超算服务器的常规操作
2. Python(pycharm/vscode),Anaconda(或Mamba)的使用,及虚拟环境配置
3. 量子化学计算软件的介绍与快速上手
4. CP2K软件的发展介绍与特点:
4.1 使用MULTIWFN快速生成单点能或分子动力学模拟的输入文件
4.2 输入文件的字段解释与注意事项
4.3 使用Python实现自动化提交任务与任务后处理
4.4 在CP2K中使用GFN1-xTB方法,适合小白低成本入门!
5. ORCA软件的发展介绍与特点:
5.1 使用MULTIWFN或基于模板快速生成单点能或分子动力学模拟的输入文件及注意事项
5.2 使用Python实现自动化提交任务与任务后处理
6. XTB软件的发展介绍与特点:
6.1 发展迅猛!年被引用增长率高达87%
6.2 执行单点能,几何优化,分子模拟等
6.3 使用Python实现自动化提交任务与任务后处理
7. DFTB(简单介绍)
7.1 执行单点能,几何优化,分子模拟等
7.2 使用Python实现自动化提交任务与任务后处理
8 分子模拟软件介绍与分类
8.1 LAMMPS的入门与使用
8.2 软件发展现状与特点
8.3 输入文件的详细解析与注意事项
8.4 分子模拟轨迹的后处理与分析
8.5 机器学习势函数使用
9. OpenMM的入门与使用
9.1 软件发展现状与特点
9.2 运行脚本与注意事项
9.3 使用sobtop软件和Python快速、自动化生成任意有机分子的力场参数文件(同时也适用GROMACS)
10. 案例:传统力场方法与机器方法力场方法的对比
1. 使用OpenMM执行有机体系的分子模拟
2. 基于机器学习力场方法,结合LAMMPS执行合金或锂电池体系的分子模拟
3.
使用MDtraj等软件进行模拟结果的后处理分析与Python高质量科研绘图,包括:能量与力的预测曲线,径向分布函数,键长键角二面角分布,电池电压曲线等
第二部分(机器学习力场的发展--不变模型系列)
理论内容
1. 科学领域的机器学习模型
1.1 机器学习模型应该遵守的几个物理对称性
1.2 高效描述局部环境方法的分类与特点
1.3 基于核方法或深度神经网络方法
1.4 基于描述符或分子图方法
2. 基于描述符的机器学习力场模型
2.1 机器学习力场的开篇工作
2.2 BPNN模型详解与发展
2.3 生态最好的机器学习力场模型
3. DeePMD系列工作的详解
3.1 DeePMD初始版本与光滑版本的模型架构及特点
3.2 DeePMD的压缩原理与特点
3.3 DPGEN的工作原理
4. 基于图框架的机器学习力场模型
4.1 图神经网络、图卷积网络和消息传递神经网络的发展与理解
4.2 图神经网络的机器学习力场模型的经典模型
4.2.1 SchNet模型的特点与代码实现
5. 基于三维空间建模的完备性与效率的几何系列模型:
5.2 DimeNet,SphereNet和ComENet模型的详解与比较
5.3 其他机器学习力场模型概述:DTNN和PhysNet等
实操内容
1. 使用dpdata进行数据格式转化,并划分成训练,验证和测试数据集
2. DeePMD的安装与输入文件详解
3. 与理论课的模型框架相对应地进行超参数设定的讲解,及使用经验
4. DeePMD的常见功能,包括训练,重启,冻结,压缩和测试
5. DeePMD的常见问题与训练过程的分析
6. 综合使用LAMMPS和DeePMD模型执行高精度的分子动力学模拟
7. 分子模拟的数据后处理与分析
8. DPGEN软件的软件介绍与工作流程
9. DPGEN软件的输入和输出文件
10. param.json和machine.json文件的参数详解
11. 跨计算计算分区提交任务的方法
12. DPGEN软件的使用命令
13. DPGEN软件的常见问题与使用经验,以及判断不同体系收敛的参考标准
第三部分(高阶课程--等变模型系列,领域热点)
理论内容
1.
不变系列模型的总结
1.1 等变模型的概念,特点,分类和应用
1.2 等变模型的几种分类
1.3 高阶等变模型的特点
1.4 超高数据利用率与优秀的泛化能力
1.5 SO(3)群的简单入门与张量积
2. 高阶等变模型与传统模型的区别,及注意事项
3. 等变机器学习力场的经典模型:
3.1Nat. Commun.上高被引的NequIP模型的详解和代码框架
实操内容
1. DeePMD软件的进阶使用与补充讲解,包括多GPU并行训练
2. 使用PCA、TSNE、UMAP等降维方法,结合K-Means聚类方法,从分子模拟轨迹中以低冗余方式提取多帧结构文件。
3. LAMMPS以多GPU并行方式运行机器学习力场模型
4. 使用Python快速可视化机器学习力场模型在等变与不变设计上的区别
5. NequIP模型的超参数介绍和使用
6. 复现Nat. Commun.文章结果,包括计算径向分布函数、键角分布等性质
7. 使用wandb进行超参数调优与训练过程中各种信息的可视化分析
第四部分
理论部分
1.
高效/高精度的基于ACE的等变模型
2. ACE方法,消息传递和等变框架的集大成——MACE模型
3. 方法的完备性,效率和系列发展
4. 机器学习力场领域的ChatGPT模型
5. 有机分子体系的通用大模型:MACE-OFF23
6. 几乎涵盖元素周期表所有元素的材料领域的通用大模型:MACE-MP0
7. 适用于大规模GPU并行框架的等变模型
8. NequIP团队在Nat. Commun.的新作--Allegro模型的方法详解与比较
实操部分
1. MACE模型和Allegro模型的超参数介绍和使用经验
2. MACE模型与DeePMD模型的对比,包括精度,数据效率等
3. Libtorch与LAMMPS软件的编译
4. 机器学习力场领域的ChatGPT的使用与分析
5. 快速上手MACE-OFF23和MACE-MP0模型
6. 对通用大模型进行微调与分析
7.
DPA-1和DPA-2的介绍与特点
部分案例图片