专栏名称: 轻松参会
回复会议名称获取交流群二维码,如“cvpr”
目录
相关文章推荐
上海社区发布  ·  减肥变厌食症!上海一成年女子体重只剩40余斤 ... ·  17 小时前  
上海社区发布  ·  减肥变厌食症!上海一成年女子体重只剩40余斤 ... ·  17 小时前  
环球网  ·  俄乌冲突三周年,联合国秘书长发表声明 ·  22 小时前  
北京大学百周年纪念讲堂  ·  多款专属周边陪你一起踏上《猫猫的奇幻漂流》! ·  昨天  
北京大学百周年纪念讲堂  ·  多款专属周边陪你一起踏上《猫猫的奇幻漂流》! ·  昨天  
参考消息  ·  商务部最新回应:敦促美方停止! ·  昨天  
谈理说法  ·  杨幂,申请强制执行! ·  3 天前  
谈理说法  ·  杨幂,申请强制执行! ·  3 天前  
51好读  ›  专栏  ›  轻松参会

清华系AI公司面壁智能招聘-大模型预训练/多模态/Agent/数据开发

轻松参会  · 公众号  ·  · 2024-05-03 10:08

正文

公司介绍
依托于扎实的原创性AI技术底蕴,面壁智能是世界范围内对「高效大模型」探索最为前列的大模型团队之一,目前已完成了贯彻高效训练、高效落地与高效推理的大模型全栈技术生产线布局。核心研发团队脱胎于清华NLP实验室,拥有中国首批大模型研发精锐力量,团队还包括来自阿里、字节、百度等国内外知名公司的人才。
过去一年,瞄准AGI这一方向,面壁选择围绕“高效大模型”这一方向,推进大模型技术发展和市场落地。在2024年2月1日的发布会上,对标Mistral,面壁智能发布了训练数据规模近1T、参数规模仅2B的模型:聚焦于适配端侧硬件的端侧大模型MiniCPM-2B。目前MiniCPM-2B在CPU(比GPU计算吞吐量低)上就能跑起来,有效降低了推理成本。同时,即便将大小压缩75%,MiniCPM的性能也能做到基本无损耗。
目前,面壁智能完成新一轮数亿元融资,继续面向AGI的高效大模型征程,面壁的大模型已经在端云侧建立起大小模型之间的协同,一方面可以提升云侧大模型的服务速度,同时与面壁端侧模型相结合,进一步显著降低大模型使用成本

招聘岗位
大模型算法工程师(预训练)

岗位职责
1参与大规模预训练语言模型的研发、部署、微调,主要涉及功能实现、性能优化、系统调优、硬件适配等工作;
2基于公司业务场景需求进行NLP相关研发;
3根据需求复现相关自然语言处理算法;
4参与前沿算法与应用的研究。

职位需求
1自然语言处理、机器学习及相关专业、3年以上相关工作经验;
2较强的算法开发能力,熟悉C++、python、shell、cuda等一种或多种编程语言;
3掌握传统NLP、深度学习NLP相关算法,并具有相关实战经验;
4熟练使用 Pytorch 深度学习框架;
5对深度学习、Transformer、预训练有一定深度的理解和经验,能根据论文复现相关算法,有大规模预训练模型研发和训练经验者优先;
6高质量相关论文ACL,EMNLP,COLING,NAACL作者优先。

工作地点:北京市
投递方式:请将简历发送至邮箱 [email protected] ,文件名称为姓名+职位


大模型算法工程师(多模态)
岗位职责
1.负责大规模多模态数据获取、清洗;负责多模态大模型(MLLM/LMM)相关技术研究,提升模型通用感知和理解能力;2.跟进业界前沿,参与多模态大模型的设计、预训练、微调、评测全流程优化工作,构建业界领先的多模态大模型;3.解决工程化和产品化过程中的难题,推动多模态大模型商业化落地。

任职要求
1.计算机科学/机器学习/人工智能/统计等相关专业,硕士及以上学历;2.在计算机视觉、多模态理解方面有扎实的研究基础,熟悉主流的多模态大模型,如Flamingo,InstructBLIP,LLaVA,Qwen-VL等,有相关实操经验者优先;3.熟悉 Linux 和 Python,熟悉Pytorch, transformers 等工具使用,了解分布式训练框架如Deepspeed、Megatron-LM等,熟悉大规模分布式训练,具备优秀的工程开发能力;4.赛事获奖、顶会论文发表或开源项目贡献者优先。

工作地点:北京市
投递方式:请将简历发送至邮箱[email protected],文件名称为姓名+职位


大模型算法工程师(AI Agent)
岗位职责
1优化模型能力以满足Agent应用场景的需求,搭建Agent框架,工作内容包括算法开发、模型训练、数据处理、服务部署等
2从全流程优化RAG效果,包括文件处理、文本切分、语义检索、检索生成、长文理解等
3优化模型调用通用搜索、代码解释、多模态等工具的能力以及复杂场景下多工具联合调用能力,提升模型对复杂任务的规划、分解、反思能力
4Agent场景下模型能力提升,优化模型对指令的遵循能力,包括但不限于人物设定、输出格式、工作流程等
5搭建Agent框架,提升Agent系统稳定性和可靠性,支持通用的agent创建平台
6跟踪和研究Agent领域最新技术动态

职位需求
1计算机、深度学习、机器学习等相关专业,硕士及以上学历
2扎实的技术基础,较强的算法开发能力,对前沿领域的研究有热情
3熟悉python和shell,熟悉pytorch/tensorflow/paddlepaddle中的一种
4熟悉常用的机器学习、深度学习算法,熟练使用 Pytorch、Huggingface、DeepSpeed 等框架
5熟悉Agent领域最新研究成果,能够阅读论文并复现

加分项
1高质量相关论文ACL、NeurIPS、EMNLP、NAACL、ICML、ICLR作者优先
2有大模型实际操作经验和相关项目经历
3熟悉langchain、llamaindex等框架

工作地点:北京市
投递方式:请将简历发送至邮箱 [email protected] ,文件名称为姓名+职位


大模型算法工程师(C端策略)
岗位职责
1开展基于大语言模型的研发工作;
2根据业务场景需求设计微调方案、适配算法和调优工程方案,并落地到行业客户的垂直场景中去
3负责大模型微调算法的开发和优化。

任职要求
1自然语言处理、机器学习及相关专业、3年以上相关工作经验;
2较强的算法开发能力,熟悉C++、python、shell、cuda等一种或多种编程语言;
3掌握传统NLP、深度学习NLP相关算法,并具有相关实战经验; 4.逻辑思维较强,具备良好的团队合作和沟通能力,能够积极参与项目的讨论和决策。

工作地点:北京市
投递方式:请将简历发送至邮箱 [email protected] ,文件名称为姓名+职位


大模型算法工程师(场景应用)
岗位职责
1开展基于大语言模型的Agent研发工作;
2根据业务场景需求设计微调方案、适配算法和调优工程方案,并落地到行业客户的垂直场景中去
3负责大模型微调算法的开发和优化。

任职要求
1自然语言处理、机器学习及相关专业、3年以上相关工作经验;
2较强的算法开发能力,熟悉C++、python、shell、cuda等一种或多种编程语言;
3掌握传统NLP、深度学习NLP相关算法,并具有相关实战经验; 4.逻辑思维较强,具备良好的团队合作和沟通能力,能够积极参与项目的讨论和决策。

工作地点:北京市
投递方式:请将简历发送至邮箱 [email protected] ,文件名称为姓名+职位






请到「今天看啥」查看全文