专栏名称: 轻松参会

回复会议名称获取交流群二维码，如“cvpr”

商汤AI大装置HPC团队招聘分布式训练/高性能计算等方向研究员

轻松参会 · 公众号 · · 2024-04-18 12:02

正文

01. 高性能云端异构计算研究员（4人）

1. 工作职责

1. 参与公司云侧大模型AI基础设施中的异构芯片高性能计算加速库和算法研发。2. 支持公司大模型业务广泛落地。

2. 任职要求

1、计算机基础扎实，熟悉C/C++和Python，具备系统软件开发架构能力。

2、熟悉计算机体系结构、并行计算、分布式计算技术。

3、熟悉CUDA GPU或者国产云端芯片（昇腾、沐曦、天数、壁仞等任一款）的异构计算的开发与调优

4、对TensorRT，ONNXRuntime等传统GPU推理部署平台，或者vLLM，TGI，TensorRT-LLM等大模型推理部署有使用和开发经验。

3. 加分项

1、熟悉模型量化，蒸馏或剪枝等至少一种压缩技术优先

2、熟悉OpenMMLab或者huggingface等算法模型池，并有相关落地部署经验的优先

3、熟悉Diffusion类模型、LLM模型，或者其他多模态模型推理部署优化的优先

4、熟悉TVM、XLA、MLIR、TRITON任意一种AI编译技术，熟悉polyhedral技术优先

02. 高性能端侧异构计算研究员（3人）

1. 工作职责

1. 参与公司端边侧大模型AI基础设施中的GPU或CPU高性能计算后端研发。2. 支持公司大模型业务广泛落地。

2. 端侧GPU侧职位要求

1. 计算机基础扎实，熟悉C/C++开发。2. 熟悉计算机体系结构以及并行计算基本技术。3. 熟悉任意一种GPU体系结构的性能调优，如OpenCL、CUDA、HIP等。4. 熟悉任意一种端侧推理引擎的优先，如ncnn、mnn、tnn等。5. 熟悉大模型和大模型推理优化技术的优先。6. 对计算优化、AI推理部署工作有强烈兴趣的优先。

3. 端侧CPU侧职位要求

1. 计算机基础扎实，熟悉C/C++开发。2. 熟悉计算机体系结构以及并行计算基本技术。3. 熟悉任意一种CPU体系结构的性能调优，如arm、x86、risc-v等。4. 熟悉任意一种端侧推理引擎的优先，如ncnn、mnn、tnn等。5. 熟悉大模型和大模型推理优化技术的优先。6. 对计算优化、AI推理部署工作有强烈兴趣的优先。

03. 大规模分布式训练优化研究员（1人）

1. 工作职责

1. 参与公司云侧大模型AI基础设施中的分布式训练的高性能优化。2. 支持公司大模型业务广泛落地。

2. 任职要求

1、计算机基础扎实，熟悉C/C++和Python，具备系统软件开发架构能力。2、熟悉计算机体系结构、并行计算、分布式计算技术。3、熟悉CUDA GPU或者国产云端芯片（昇腾、沐曦、天数、壁仞等任一款）的异构计算的开发与调优

3. 加分项

1、熟悉colossal-AI, pytorch, deep speed, megaton,等任意一种分布式训练框架2、熟悉MPI、NCCL等通信库，有高性能以太网等优化经验，或者RDMA高性能通信库开发及优化经验

简历发送至邮箱： [email protected] ，期待你的加入，谢谢大家！

【 轻松参会 】为所有

请到「今天看啥」查看全文

推荐文章

中国基金报 · 祝卫东谈高额彩礼问题

10 小时前

银行螺丝钉 · ［2月24日］指数估值数据(港股科技股回调；长期纯债基金大跌，该怎么办；月薪宝发薪日；黄金星级更新）

13 小时前

中国基金报 · 特朗普突然宣布：换人！

2 天前

中国基金报 · 今夜，大涨！

3 天前

中国基金报 · 刚刚！最高检、证监会，联合发布！

3 天前

THLDL领导力 · 有钱也买不到的是“点子”！点石成金容易，能想到此法不容易！

8 年前

半导体行业观察 · 国产集成电路设备逐渐打破欧美日垄断？大家怎么看！

8 年前

瞭望消金 · 整治风暴开始，现金贷、消费金融、校园贷成重灾区

7 年前

IPRdaily · 「迅雷XUNLEI」商标撤销复审案（附：决定书）

7 年前

杭州楼市365 · 杭州“双子大厦”要变颜色了！铁路北单元新增一所小学…详戳

7 年前