1. 参与公司云侧大模型AI基础设施中的异构芯片高性能计算加速库和算法研发。2. 支持公司大模型业务广泛落地。
1、计算机基础扎实,熟悉C/C++和Python,具备系统软件开发架构能力。
2、熟悉计算机体系结构、并行计算、分布式计算技术。
3、熟悉CUDA GPU或者国产云端芯片(昇腾、沐曦、天数、壁仞等任一款)的异构计算的开发与调优
4、对TensorRT,ONNXRuntime等传统GPU推理部署平台,或者vLLM,TGI,TensorRT-LLM等大模型推理部署有使用和开发经验。
1、熟悉模型量化,蒸馏或剪枝等至少一种压缩技术优先
2、熟悉OpenMMLab或者huggingface等算法模型池,并有相关落地部署经验的优先
3、熟悉Diffusion类模型、LLM模型,或者其他多模态模型推理部署优化的优先
4、熟悉TVM、XLA、MLIR、TRITON任意一种AI编译技术, 熟悉polyhedral技术优先
1. 参与公司端边侧大模型AI基础设施中的GPU或CPU高性能计算后端研发。2. 支持公司大模型业务广泛落地。
1. 计算机基础扎实,熟悉C/C++开发。2. 熟悉计算机体系结构以及并行计算基本技术。3. 熟悉任意一种GPU体系结构的性能调优,如OpenCL、CUDA、HIP等。4. 熟悉任意一种端侧推理引擎的优先,如ncnn、mnn、tnn等。5. 熟悉大模型和大模型推理优化技术的优先。6. 对计算优化、AI推理部署工作有强烈兴趣的优先。
1. 计算机基础扎实,熟悉C/C++开发。2. 熟悉计算机体系结构以及并行计算基本技术。3. 熟悉任意一种CPU体系结构的性能调优,如arm、x86、risc-v等。4. 熟悉任意一种端侧推理引擎的优先,如ncnn、mnn、tnn等。5. 熟悉大模型和大模型推理优化技术的优先。6. 对计算优化、AI推理部署工作有强烈兴趣的优先。
1. 参与公司云侧大模型AI基础设施中的分布式训练的高性能优化。2. 支持公司大模型业务广泛落地。
1、计算机基础扎实,熟悉C/C++和Python,具备系统软件开发架构能力。2、熟悉计算机体系结构、并行计算、分布式计算技术。3、熟悉CUDA GPU或者国产云端芯片(昇腾、沐曦、天数、壁仞等任一款)的异构计算的开发与调优
1、熟悉colossal-AI, pytorch, deep speed, megaton,等任意一种分布式训练框架2、熟悉MPI、NCCL等通信库,有高性能以太网等优化经验,或者RDMA高性能通信库开发及优化经验
简历发送至邮箱:
[email protected]
,期待你的加入,谢谢大家!
【
轻松参会
】为所有