专栏名称: 轻松参会
回复会议名称获取交流群二维码,如“cvpr”
目录
相关文章推荐
新周刊  ·  焦虑的打工人,被这个俄国文学家给骂爽了 ·  20 小时前  
新周刊  ·  喊停加盟,喜茶刹得住新茶饮的“内卷”吗? ·  20 小时前  
码头青年  ·  南方来了个新闻老兵 ·  2 天前  
新周刊  ·  我会的沪语,八成从她的脱口秀里学 ·  3 天前  
51好读  ›  专栏  ›  轻松参会

阿里智信AI infra团队大模型训推实习生招聘

轻松参会  · 公众号  ·  · 2024-04-20 17:45

正文

知乎原帖:

https://zhuanlan.zhihu.com/p/692727836


职位描述

2021年4月,阿里集团成立智能信息事业群,聚焦AI技术在信息服务赛道的创新应用,从工具到服务,持续为用户提供高效、智能的互联网产品。智能信息事业群核心产品为夸克APP、UC浏览器、书旗小说、超级汇川等,以多APP矩阵,覆盖横跨各年龄段的数亿用户人群,服务超10万客户。

目前我们正在用大模型服务于公司的多条业务线,作为智能信息的AI Infra团队,在这里你将深入参与到大模型的训练和推理中:

1、参与大模型离线训练的效率和稳定性提升的工作;

2、参与大模型在线inference吞吐/延迟优化,提升inference性价比的工作;

3、参与上述算力加速软硬件及平台体系化的设计和建设工作,支撑大模型能力建设和落地应用。

职位要求,具备以下一项或多项能力:

1. 熟悉C/C++、Python等至少一门编程语言,以及Linux下的开经验

2. 了解常用机器学习算法,对文本/多模态大模型相关领域模型,有极佳的工程实现能力,了解TF/Pytorch/Jax等深度学习框架,有相关模型训练和模型效果优化者优先

3. 了解大模型MegatronLM/Deepspeed/Colossal分布式训练框,了解模型量化、蒸馏、剪枝等模型优化原理和策略,有相关训练、调优经验优先

4. 了解或使用过使用包括vllm/tgi/tensorrtLLM等模型推理服务框架,有代码分析及实践经验优先

5. 了解GPU/ASIC芯片,了解硬件系统架构,能够针对性的编写高性能的算子实现,有分析及调优能力

6. 在训练/推理加速相关领域的研究和成果发表者优先 ,十分欢迎有HPC或体系结构背景的同学

同时我们还希望你

1、学习能力强,有良好的英文论文阅读能力,对新事物保有好奇心,并能快速适应新环境;

2、良好的沟通能力和团队协同能力;能与他人合作,共同完成目标;

3、对所在领域有热情,相信方法总比困难多,善于独立思考并反思总结。

base地点:广州,欢迎感兴趣的同学留言、私聊或发送简历到邮箱[email protected]


轻松参会 】为所有 CCF收录会议 期刊 设立投稿交流群,







请到「今天看啥」查看全文