如何丝滑的训练大模型？

DataFunTalk · 公众号 · · 2024-08-02 13:00

正文

8月3日，在DataFunSummit2024： 大模型技术峰会 ，由 百川智能AI Infra负责人苏磊 出品的大模型训练推理论坛，将邀请来自 滴普科技、Alluxio、百川智能 的三位嘉宾，就大模型最新的训练推理及微调技术进行分享，感兴趣的小伙伴欢迎 识别二维码免费报名 ，收看直播：

扫码免费报名，收看直播

详细介绍：

出品人：苏磊百川智能 AI Infra 负责人

个人介绍：先后在 IBM、腾讯、华为等公司任职技术负责人。聚焦于 HPC 和 AI 基础设施领域，覆盖解决方案设计和全栈算力优化。多次完成从0到1的企业级技术创新产品孵化和商业交付，获得数个高性能计算、集群调度领域相关中美技术专利。

张敢滴普科技基础模型研究部总监

个人介绍：超过十年的企业服务研发与管理经验，曾先后负责大数据基础组件、搜索引擎、大模型应用的技术研发工作，目前主要在北京滴普科技负责基础模型和语料加工的技术创新，践行 LLMOps 和 Data-Centric AI。

演讲题目：Deepexi 企业大模型在知识问答领域的落地实践

演讲提纲：本次分享主要介绍滴普科技在企业大模型微调 + RAG 的落地实践，如何通过解决实践中出现的问题，提升垂直领域知识问答的准确率，包括模型微调、RAG 召回率、语料加工等方向。具体包括：

1. 滴普企业大模型方案

2. 模型微调

3. RAG 提升

4. 未来规划

听众收益：

1. 企业大模型在实践中都有哪些常见问题？

2. 垂直领域知识问答的准确率该如何提升？

3. RAG 该如何提升？

王宇阳 Alluxio 高级工程师

个人介绍：多年分布式对象存储和 HDFS 存储的核心设计、开发及维护经验。目前主要负责 Alluxio S3 协议和底层存储等方面的研发和优化工作。

演讲题目：有效解决数据驱动型人工智能面临的 I/O 挑战

演讲提纲：随着人工智能技术的飞速发展，数据已成为推动 AI 进步的核心动力。在这一背景下，快速地处理和访问大规模数据集对于 AI 模型的训练和部署显得尤为关键。但是，I/O 的性能瓶颈经常成为制约效率和限制 GPU 资源充分利用的主要障碍。在本次研讨活动中，我们将展示如何利用 Alluxio 构建一个高效的数据访问层，以应对 I/O 挑战并显著增强 GPU 的使用效率。结合多个实际案例和详实的实验数据，参与者将掌握在 Alluxio 中缓存数据集和模型的技巧，并认识到这种优化能带来多大的性能提升。具体包括：

1. 分析 I/O 挑战的常见形式及其对 GPU 使用效率和整体性能的具体影响

2. 探讨如何将高效的数据访问层与机器学习流程无缝结合，减少 I/O 延迟

3. 讨论提升 AI 工作负载性能的缓存策略

4. 探索未来提升数据访问效率和加速 AI 工作负载的发展方向

听众收益：听众将获得对数据驱动型 AI 工作负载所面临的 I/O 问题的深刻理解，并将学习到如何有效运用 Alluxio 来解决这些问题。我们将重点介绍来自互联网、汽车、AI 制药等行业数字化转型领先企业的实际操作经验，以及我们的解决方案如何正面影响 GPU 的使用效率和整体性能表现。

肖彬百川智能高级专家

如何丝滑的训练大模型？

正文

请到「今天看啥」查看全文