专栏名称: 轻松参会
回复会议名称获取交流群二维码,如“cvpr”
目录
相关文章推荐
中国基金报  ·  祝卫东谈高额彩礼问题 ·  10 小时前  
银行螺丝钉  ·  [2月24日]指数估值数据(港股科技股回调; ... ·  13 小时前  
中国基金报  ·  特朗普突然宣布:换人! ·  2 天前  
中国基金报  ·  今夜,大涨! ·  3 天前  
中国基金报  ·  刚刚!最高检、证监会,联合发布! ·  3 天前  
51好读  ›  专栏  ›  轻松参会

商汤AI大装置HPC团队招聘分布式训练/高性能计算等方向研究员

轻松参会  · 公众号  ·  · 2024-04-18 12:02

正文

01. 高性能云端异构计算研究员(4人)
1. 工作职责
1. 参与公司云侧大模型AI基础设施中的异构芯片高性能计算加速库和算法研发。2. 支持公司大模型业务广泛落地。
2. 任职要求
1、计算机基础扎实,熟悉C/C++和Python,具备系统软件开发架构能力。
2、熟悉计算机体系结构、并行计算、分布式计算技术。
3、熟悉CUDA GPU或者国产云端芯片(昇腾、沐曦、天数、壁仞等任一款)的异构计算的开发与调优
4、对TensorRT,ONNXRuntime等传统GPU推理部署平台,或者vLLM,TGI,TensorRT-LLM等大模型推理部署有使用和开发经验。
3. 加分项
1、熟悉模型量化,蒸馏或剪枝等至少一种压缩技术优先
2、熟悉OpenMMLab或者huggingface等算法模型池,并有相关落地部署经验的优先
3、熟悉Diffusion类模型、LLM模型,或者其他多模态模型推理部署优化的优先
4、熟悉TVM、XLA、MLIR、TRITON任意一种AI编译技术, 熟悉polyhedral技术优先


02. 高性能端侧异构计算研究员(3人)
1. 工作职责
1. 参与公司端边侧大模型AI基础设施中的GPU或CPU高性能计算后端研发。2. 支持公司大模型业务广泛落地。
2. 端侧GPU侧职位要求
1. 计算机基础扎实,熟悉C/C++开发。2. 熟悉计算机体系结构以及并行计算基本技术。3. 熟悉任意一种GPU体系结构的性能调优,如OpenCL、CUDA、HIP等。4. 熟悉任意一种端侧推理引擎的优先,如ncnn、mnn、tnn等。5. 熟悉大模型和大模型推理优化技术的优先。6. 对计算优化、AI推理部署工作有强烈兴趣的优先。
3. 端侧CPU侧职位要求
1. 计算机基础扎实,熟悉C/C++开发。2. 熟悉计算机体系结构以及并行计算基本技术。3. 熟悉任意一种CPU体系结构的性能调优,如arm、x86、risc-v等。4. 熟悉任意一种端侧推理引擎的优先,如ncnn、mnn、tnn等。5. 熟悉大模型和大模型推理优化技术的优先。6. 对计算优化、AI推理部署工作有强烈兴趣的优先。


03. 大规模分布式训练优化研究员(1人)
1. 工作职责
1. 参与公司云侧大模型AI基础设施中的分布式训练的高性能优化。2. 支持公司大模型业务广泛落地。
2. 任职要求
1、计算机基础扎实,熟悉C/C++和Python,具备系统软件开发架构能力。2、熟悉计算机体系结构、并行计算、分布式计算技术。3、熟悉CUDA GPU或者国产云端芯片(昇腾、沐曦、天数、壁仞等任一款)的异构计算的开发与调优
3. 加分项
1、熟悉colossal-AI, pytorch, deep speed, megaton,等任意一种分布式训练框架2、熟悉MPI、NCCL等通信库,有高性能以太网等优化经验,或者RDMA高性能通信库开发及优化经验


简历发送至邮箱: [email protected] ,期待你的加入,谢谢大家!


轻松参会 】为所有







请到「今天看啥」查看全文