专栏名称: DataFunTalk
专注于大数据、人工智能领域的知识分享平台。
目录
相关文章推荐
顽主杯实盘大赛  ·  大娃封神一战 ·  2 天前  
顽主杯实盘大赛  ·  大娃封神一战 ·  2 天前  
51好读  ›  专栏  ›  DataFunTalk

如何丝滑的训练大模型?

DataFunTalk  · 公众号  ·  · 2024-08-02 13:00

正文

8月3日,在DataFunSummit2024: 大模型技术峰会 ,由 百川智能AI Infra负责人苏磊 出品的大模型训练推理论坛,将邀请来自 滴普科技、Alluxio、百川智能 的三位嘉宾,就大模型最新的训练推理及微调技术进行分享,感兴趣的小伙伴欢迎 识别二维码免费报名 ,收看直播:

扫码免费报名,收看直播

详细介绍:

出品人:苏磊 百川智能 AI Infra 负责人

个人介绍:先后在 IBM、腾讯、华为等公司任职技术负责人。聚焦于 HPC 和 AI 基础设施领域,覆盖解决方案设计和全栈算力优化。多次完成从0到1的企业级技术创新产品孵化和商业交付,获得数个高性能计算、集群调度领域相关中美技术专利。

张敢 滴普科技 基础模型研究部总监

个人介绍:超过十年的企业服务研发与管理经验,曾先后负责大数据基础组件、搜索引擎、大模型应用的技术研发工作,目前主要在北京滴普科技负责基础模型和语料加工的技术创新,践行 LLMOps 和 Data-Centric AI。

演讲题目:Deepexi 企业大模型在知识问答领域的落地实践

演讲提纲:本次分享主要介绍滴普科技在企业大模型微调 + RAG 的落地实践,如何通过解决实践中出现的问题,提升垂直领域知识问答的准确率,包括模型微调、RAG 召回率、语料加工等方向。具体包括:

1. 滴普企业大模型方案

2. 模型微调

3. RAG 提升

4. 未来规划

听众收益:

1. 企业大模型在实践中都有哪些常见问题?

2. 垂直领域知识问答的准确率该如何提升?

3. RAG 该如何提升?

王宇阳 Alluxio 高级工程师

个人介绍:多年分布式对象存储和 HDFS 存储的核心设计、开发及维护经验。目前主要负责 Alluxio S3 协议和底层存储等方面的研发和优化工作。

演讲题目:有效解决数据驱动型人工智能面临的 I/O 挑战

演讲提纲:随着人工智能技术的飞速发展,数据已成为推动 AI 进步的核心动力。在这一背景下,快速地处理和访问大规模数据集对于 AI 模型的训练和部署显得尤为关键。但是,I/O 的性能瓶颈经常成为制约效率和限制 GPU 资源充分利用的主要障碍。在本次研讨活动中,我们将展示如何利用 Alluxio 构建一个高效的数据访问层,以应对 I/O 挑战并显著增强 GPU 的使用效率。结合多个实际案例和详实的实验数据,参与者将掌握在 Alluxio 中缓存数据集和模型的技巧,并认识到这种优化能带来多大的性能提升。具体包括:

1. 分析 I/O 挑战的常见形式及其对 GPU 使用效率和整体性能的具体影响

2. 探讨如何将高效的数据访问层与机器学习流程无缝结合,减少 I/O 延迟

3. 讨论提升 AI 工作负载性能的缓存策略

4. 探索未来提升数据访问效率和加速 AI 工作负载的发展方向

听众收益:听众将获得对数据驱动型 AI 工作负载所面临的 I/O 问题的深刻理解,并将学习到如何有效运用 Alluxio 来解决这些问题。我们将重点介绍来自互联网、汽车、AI 制药等行业数字化转型领先企业的实际操作经验,以及我们的解决方案如何正面影响 GPU 的使用效率和整体性能表现。


肖彬 百川智能 高级专家







请到「今天看啥」查看全文