大家好,我是吴师兄。
对于想求职大模型方向的同学来说,很长时间都在思考这个问题:
到底怎么才能拿到大模型offer?
在回答这个问题之前,我们首先要去了解一下什么大模,实际上不管是大模型的求职也好,我们现在的整个的这个求职也好,其实是一场
开卷考试
。
为什么很多的同学觉得求职就是现在这个环境这么差,找工作这么难,是因为大部分的同学我们都是摸着虾去求职的。
他们的信息基本上来自于身边的同学,你准备了什么项目,你投了哪一个,这个公司我也投一下,那么很多的同学都是这样去求职的。
我为了去得到这个项目,我应该去怎么准备,可能我在面试之前或者面试的前半年开始焦虑了,之后,我问各种各样的人,我怎么去准备,但是如果说我们从现在一开始就知道我到底应该学什么样的技能,准备什么样的项目,那么怎么去准备面试完了之后怎么复盘,然后面对不同场景的时候该说什么这个话,那大模型这个不管是大模型的面试也好,整个的求职面试,求职过程也好,对你来说就是一场开卷考试。
如果是聚焦到大模型的求职,这个方向其实就是两个点。
第一个点叫
把你自己变成一篇四平八稳的八股文
,第二个在这篇八股文的基础上
有一到两个亮点
。
对于绝大部分按部就班的按照大学课程规划来学习的同学来说,除了极个别就是非常拔尖的,大家的经历,大体都是相似的。
可能 24 年或 23 年的下半年到 24 年上半年就是看到既有 RAG 也有 agent,同时还有微调经验的同学相对来说不多,但是到了 24 年的秋招开始,大部分的求职的像大型方向求职的同学都是这样的简历。
见多了就见怪不怪了,就不会觉得这个同学有多么的优秀,就开始进入了一种,
卷学历也好,卷背景也好,卷论文也好,这样的这个死循环里面,那但是如果说你有一个这样的工业级的项目的实战
。
同时,有一到两个亮点,比如说能够体现出你在这个里面的思考。
比如说你在原来的做 SFT 做微调的基础上去做了一个 RUHF 去做了一个强化学习,那你为什么原来的 SFT 做微调到底是哪些情况下,没有满足我们这个工业场景的使用需求?那你怎么去做的,强化学习的数据怎么构造的,reward model 是怎么构建的,用的策略还是用的,比如说大模型的评估,还是我们训练了一个 reward model 到底是怎么训练,用什么样的数据训练的,那最后,加了 RHF 之后的这个效果评估是怎么做的,那如果说你有了这个思考量,
那你和面试官聊天的时候是完全不一样的
。
因为大家要知道一件事情,大厂面试官也都是打工人,就是从早到晚都是一直在工作,而且每天工作时间非常长。
很多时候。面试其实是一个放松聊天的过程
。
那如果说你把这个面试官聊了你的经历能让他产生非常强的共鸣,能让他产生极强的兴趣,如果说你取得更好的排序,你拿 offer 的概率是会大大提升。
这个叫四平八股文的八股文就是什么,就是别人有的我都有。
我们该有工业级的项目经验,该去掌握一些这个背一些八股去了解整个这个知识的框架,最后再在这个业务里面体现出我们对这个业务的思考,去解决问题的过程。
这个是核心的东西
。
就比如说现在你只是想去学习一下,我怎么去做个微调,我怎么去做一个强化学习,我怎么去,比如说做一个这个 RAGA 的项目,其实网上也有很多的课程。
比如说他们做微调很简单,就是我下 1 个公开数据集,我用这个 transformers 库,那些固定的这个代码,把这个数据集一传,甚至什么,lamafactory 一键训练。
你把这个数据集可能写个脚本构造成每一个模型需要的那个 template的模板就可以了,就一键训练。可能半个小时,你就把这个过程跑通了,然后我们看到loss 下降慢慢的下降到了一个比较低的水平,就感觉我会微调了,但不是这样的,你要去理解场景。知道这个场景里面怎么去构造数据集,遇到不同的问题该怎么去调餐,就是你正式的想要去决定,我们要去学这个方向之前你首先需要去想一想。
你不管是校招社招还是转行,我们到底想往哪一个方向去做,因为大模型的算法工程师的话,它有四个不同的方向就
。
大致的分可以分成四个不同的方向。
第一个是数据层,第二个是基础模型层,第三个是应用层,第四个是 infer 层,也就是底层的硬件优化。
这四个方向也都给出一些建议和策略,这里就不具体展开讲了。
说了这么久,最核心的内容还是需要有一个有亮点的项目。
通过项目体系化的掌握面试里会考察的方方面面的考点。
如果你打算从现在开始,准备半年,秋招冲一波算法岗,那么可以考虑下面的大模型实战课程。