专栏名称: 轻松参会
回复会议名称获取交流群二维码,如“cvpr”
目录
相关文章推荐
地刊速览  ·  EPSL:古太平洋的缺氧事件 ·  3 小时前  
地刊速览  ·  EPSL:古太平洋的缺氧事件 ·  3 小时前  
51好读  ›  专栏  ›  轻松参会

商汤研究院基础语言模型团队招聘大语言模型算法研究员

轻松参会  · 公众号  ·  · 2024-05-19 10:18

正文

商汤科技
作为人工智能软件公司,商汤科技以“坚持原创,让AI引领人类进步”为使命,旨在持续引领人工智能前沿研究,持续打造更具拓展性更普惠的人工智能软件平台,推动经济、社会和人类的发展,并持续吸引及培养顶尖人才,共同塑造未来。2024年4月23日,商汤科技带来全新升级的「日日新SenseNova 5.0」大模型,具备更强的知识、数学、推理及代码能力,综合性能全面对标 GPT-4 Turbo,并在主流客观评测上达到或超越 GPT-4 Turbo。
大语言模型算法研究员
坐标:深圳/香港/上海/北京
薪资:面议
岗位职责
作为大语言模型算法研究员,你将参与“商量SenseChat”基座模型的核心关键技术研发,持续提升模型的通用人工智能能力,并支持重点行业头部客户的大模型业务落地;在这里你也会有与行业内顶尖专家交流合作的机会,共同挑战通用人工智能的技术边界。
1. 与数据团队合作,筛选、清理与标注用于训练的数据集;
2. 通过模型预训练、SFT、RLHF等流程持续提升模型的性能与安全性;
3. 跟踪最新的LLM等通用大模型研究,以改进和创新模型架构和应用场景;
4. 与产品开发团队紧密合作,将训练好的模型集成到公司产品中;
5. 编写技术文档,记录模型架构、训练过程及性能评估。
岗位要求
1. 计算机科学、数学、统计学或相关领域的硕士学位;
2. 至少3年相关工作经验,具有在生产环境中训练深度学习模型的经验;
3. 熟悉Python编程语言以及深度学习框架,如TensorFlow或PyTorch;
4. 对NLP和机器学习算法有深入理解,包括但不限于BERT、GPT、Transformer等;
5. 具有使用大规模数据集进行分布式训练的经验;
6. 良好的数据分析和问题解决能力;
7. 强大的沟通技巧和团队合作精神。
加分项
1. 博士学位持有者或具有相关领域的研究背景;
2. 有进行超大规模机器学习任务的经验;
3. 具备生产级别系统设计和架构的知识;
4. 发表过相关领域的研究论文或参与过开源项目。
投递方式
📪 [email protected]
邮件标题和简历标明:姓名-岗位名称


轻松参会 】为所有







请到「今天看啥」查看全文