专栏名称: 天池大数据科研平台
天池,基于阿里云的开放数据处理服务ODPS,面向学术界开放海量数据和分布式计算资源,旨在打造“数据众智、众创”第一平台。在这里,人人都可以玩转大数据,共同探索数据众创新模式。
目录
相关文章推荐
大数据文摘  ·  OpenAI ... ·  5 天前  
数据派THU  ·  统一视觉理解与生成,MetaMorph模型问 ... ·  4 天前  
软件定义世界(SDX)  ·  数字化转型战略咨询及IT总体规划 ·  6 天前  
51好读  ›  专栏  ›  天池大数据科研平台

《Data-juicer系列学习赛》高能开启,Air Pods等奖品等你来拿,速来挑战!

天池大数据科研平台  · 公众号  · 大数据  · 2024-12-30 15:30

主要观点总结

阿里云天池推出了首期《小白入门系列》学习赛,旨在帮助对AI领域感兴趣但缺乏背景知识的朋友快速入门机器学习。随着第一期的学习赛火热进行,第二期《Data-juicer系列学习赛》已上线。这一期以数据为中心,带来了Data-Juicer系统,聚焦数据处理质量与能力。竞赛包括多个主题,如Modelscope-Sora挑战赛、FT-Data Ranker大语言模型微调数据赛等。参与者可以在竞赛中提升技能,还有机会获得丰富的荣誉奖励。

关键观点总结

关键观点1: 阿里云天池推出《小白入门系列》学习赛

为缺乏AI背景知识的朋友提供快速入门的机会,通过一系列精心设计的学习、实践与交流环节,让参与者掌握机器学习等知识。

关键观点2: Data-Juicer系统的介绍

Data-Juicer是一站式大模型数据处理系统,提供海量的数据处理算子和工具,帮助用户轻松上手数据分析、清洗和生成。

关键观点3: 多样化的竞赛主题

包括Modelscope-Sora挑战赛、FT-Data Ranker大语言模型微调数据赛等,这些竞赛聚焦于数据质量与处理能力的提升。

关键观点4: 丰富的竞赛收获

参与者在竞赛中能获得数据分析、处理和生成能力的显著提升,还有机会获得Air Pods、kindle、天猫精灵、阿里云纪念徽章等荣誉奖励。


正文

为了帮助更多对Al领域感兴趣但缺乏背景知识的朋友快速入门,阿里云天池特别推出了首期系列学习赛 《小白入门系列》,通过一系列精心设计的学习、实践与交流环节,让参与者能够从零开始系统地了解和掌握机器学习等知识。

自第一期《小白入门系列》上线后,已有超2000位挑战者纷纷加入参赛!在第一期比赛火热进行中的同时,第二期《Data-juicer系列学习赛》已重磅上线!准备好迎接数据处理的终极挑战了吗?

这次,我们带来了开源的一站式大模型数据处理系统——Data-Juicer,它不仅提供了海量的数据处理算子和工具,还能让你轻松上手,玩转数据分析、清洗和生成!


01

专业且丰富的学习机会


以数据为中心的挑战

每一项任务都聚焦于数据的质量与处理能力,助你打造更强的大模型!

丰富的文档资源

详细的文档和友好的设计,确保你快速掌握所有技巧,成为数据处理高手!


02

多样化的竞赛主题

Modelscope-Sora 挑战赛

精洗视频多模态数据,训练出高效的类Sora多模态大模型

FT-Data Ranker 大语言模型微调数据赛 (7B)

优化数据集,提升模型性能,加速形成基准驱动的数据开发流程

FT-Data Ranker 大语言模型微调数据赛 (1B)

积累在不同规模模型上的微调经验,全面提升微调领域能力

Better Synth 多模态大模型数据合成挑战赛

通过高效的数据合成方法,实现图像理解多模态大模型的高效训练

BetterMixture 大模型微调数据混合挑战赛

精选和优化数据集,探索前沿的数据混合策略,提升模型性能


03

丰富的竞赛收获


技能提升

参与 Data-juicer 系列学习赛,你将在多个方面实现技能的显著提升。无论是数据分析、处理还是生成能力,通过应对不同主题的竞赛任务,你都将获得系统的锻炼和强化。

荣誉奖励

各赛事设置了Air Pods、kindle、天猫精灵、阿里云纪念徽章等奖品,奖励认真学习的你!


更多比赛详情请见海报↓


相关阅读