以下
文
章来源于微信公众号:包包算法笔记
作者:包包闭关修炼
链接:https://mp.weixin.qq.com/s/MeD8q_Wft3TLr6EcTmT50Q
本文仅用于学术分享,如有侵权,请联系
后
台作删文处理
DeepSeek的爆火为国产大模型打开了局面,那么DeepSeek对大模型算法工程师有什么影响呢。本文将从一个大模型算法工程师从业者的视角为大家分析,希望对大家有所帮助。
DeepSeek R1发布,对大模型算法工程师这一岗位的影响。给各位想参与到这个行业中的技术同学,一点参考。
可以显著感受的趋势是,基座的门槛进一步提高,万卡,算法infra背景成为刚需标配,玩法进一步向大工程,集团化,精英化作战转型,强调单兵创新能力。过去做基座的有一句玩笑话,对比OpenAI国产大模型永远落后,永远追赶,永远有饭吃。现在你们的同行已经不落后了,那你们呢?
应用这块,就更惨烈了。过往大模型算法应用工程师最大的门槛就是微调。现在除了一些极其少数的场景,微调是完全没有必要。但也增加了更多的知识库检索,联网检索的需求。未来AIGC应用团队将不需要算法岗位。所以大模型首先替代掉的就是原来的大模型应用算法工程师,那些蒸馏数据,洗数据,微调的同学们,尤其是在一些泛C端场景,通用场景,与基座能力重合度高的场景,二次开发毫无必要。
另一个带来变化的是,Deepseek将扯下国央企主打的行业大模型的最后一块遮羞布,搞点数据在qwen上微调下发个通稿的事儿将成为笑话,政企的单子也会越来越少,越来越多的甲方选择自己部署R1+知识库+联网。猛猛过拟合行业数据,导致通用稀烂,也干不过R1+RAG+联网。除了一些成本,安全等特殊考虑,AGI首先让一些石油,电力,通信,医疗,XXX大模型都不存在了。如果大家对AGI的三个字的含义有所理解的话,就明白上面的事就是他们通往通用人工智能上要扫除的拦路石,搞行业大模型本身就是对AGI三个字的质疑和信仰不坚定。
现在各家大公司,不管是因为组织原因反应迟钝,还是中层利益根深蒂固,还在按照原有的思维方式招聘和组建团队。deepseek带来的变化将是深远的,短期也将能看到一些显著的、具体的变化:
-
基座算法门槛进一步提高,算法+infra背景将会更受欢迎。
-
基座玩家越来越少,需求越来越少,大模型基座逐渐芯片化,变成高投入的,高人才密度,高通用的基建。
-
大模型应用“算法”工程师需求将急剧减少,只会留下大模型应用工程师,回归工程师本质。
-
传统意义的算法上,检索算法工程师,推理算法工程师,定制化推理硬件开发的需求将会变大。
-
现在算法从业者最多的,在大厂数量也最多的,业务BP类算法工程师,利用大模型生成个文案,打个标签,理解个图像文本内容,塞进成熟的业务模型里面,也能继续涨指标混口饭吃,不会受太大的影响。
以上变化背后的原因只有一个,就是在他名字里,AGI三个字母。历史上从未有过如此高泛化能力的技术,并且肉眼可见得在高泛化,通用的目标上越来越近。推演出来,确实是技术红利,但过于赢家通吃,意味着大部分技术从业者都与这场技术红利无关。
有人说跟过往的安卓有区别吗,会不会催生培训班3个月35k的神话?答案是不会,安卓是移动互联网蓝海市场爆发,技术门槛虽然降低,但降的恰到好处,远不是低到现在产品可以写prompt的程度。还是需要一个专科毕业生猛猛学三个月的,那时候流行“只差一个程序员了”的说法。但现在完全没有只差一个大模型应用算法工程师的说法,很多小AIGC的初创团队,只需要产品和前后端,要算法并没有什么用。
字节给大模型应用算法工程师校招开50K的神话,将会是昙花一现,一个非常短的窗口红利期。
大厂之外,更多的岗位正在由一大票要搞AI转型的企业创造,但也会快速出清。在这场技术大变局背后,一些变化正在悄然产生,大模型首先替代掉的就是那些大模型应用算法工程师,淘汰掉一些基座玩家,让紧紧围绕这条赛道的技术玩家先吃当头一棒。
但也不要太悲观,最终AGI目标,“通用”,会让所有人获利。