本文主要描述了一起关于实习生破坏大模型训练的事件及其发酵过程,事件涉及GPU集群的使用和社交媒体上的讨论热潮。同时介绍了事件涉及的各方的观点,以及从宇宙厂发布的官方公告中获取的信息。最后提到了建立相关交流群和相关学习资料的分享。
宇宙厂发布官方公告澄清事实,确认实习生对GPU集群的破坏行为,并透露了一些细节,如损失大小、实习生的处理情况等。
文中提到了3D视觉交流群的建立,分享学习资源,包括秘制视频课程、最新顶会论文、计算机视觉书籍等,并提供了加入方式。
来源:公子龙
添加小助理:cv3d008,备注:方向+学校/公司+昵称,拉你入群。文末附3D视觉行业细分群。
扫描下方二维码,加入「
3D视觉从入门到精通
」知识星球
,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料:
近20门秘制视频课程
、
最新顶会论文
、计算机视觉书籍
、
优质3D视觉算法源码
等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入!
我一般不吃瓜,除非,这个瓜离自己很近。
新鲜的,今天下午快三点的时候,宇宙厂发了个公告,「关于“实习生破坏大模型训练”的事实澄清」:
这起事件因为反转过多,都上了几回热搜了,我这里梳理一下整个事件的来龙去脉,可谓是一波三折,甚至到现在,真相还是扑朔迷离。
1.
前几天,一段微信聊天记录被疯狂转发,但离奇的是,这段聊天记录的时间是9月中旬,而所说的事件发生时间,已经是今年6月份的事情了:
由于聊天记录里也贴了被怀疑对象的谷歌学术主页和发表论文截图信息,考虑到隐私问题,我这里就没有贴上来了。
看起来就是因为宇宙厂的某实习生因为不满意工作安排,通过技术手段,对 GPU 集群做了手脚,而且因为手法灵巧,加上自己躬身入局,每天还参加同事们的 debug 排查会议,根据最新进展,来不断更新自己小手段,导致人才济济的技术团队,几十位技术高手都没有排查到问题,最终耗费了两个月才定位到罪魁祸首。
要知道,GPU 集群的成本非常高昂,长达两个月无效训练着,浪费了海量资金,于是这件事情的性质就开始改变了,要有定损,同时也要让始作俑者付出代价。
搞事情,还是得看顶尖高校的顶尖人才,上个班都搞出来间谍攻防的大戏,聪明人的瓜,吃起来都有点烧脑筋。
2.
好的,第一个反转来了,因为当天事件发酵的比较厉害,当事实习生很快就收到了消息,开始给出「真相」,说自己是被甩锅的一方,投毒这件事不是他干的,而是被诬陷了。
当时看到这里,我有一点感慨,网上的消息真的不能信呀,这位实习生真是个冤大头,白白蒙受了这样的误会。
别看转发的主要群体基本是沉闷的程序员,但正是因为平时娱乐活动少,在网上吃瓜这块积极性反而相当高,现在这样的负面消息在整个圈子传开,对于当事人后续求职就业,负面影响非常大。
3.
就在我感慨的时候,没想到,事件又出现了反转,这次是从开源社区Github上面传出来的,新鲜的,昨天建立的项目。
项目中给出了直接对该实习生的指控,声泪俱下的陈述了该部门三十多位员工,因为这次攻击事件,该季度几乎没有产出,还给出了声称是公司内部审查时的录音,并且最后放了狠话,愿意在适当时机,与当事人当面对峙,让真相水落石出。
总结一句话就是说,不认可、愤怒于该实习生的洗白行为,要坚持让真相水落石出,维护正义。
看完这个最新的材料,我开始懊悔自己怎么这么容易被他人的话语所左右,看起来这个实习生不仅搞事情时心思缜密,操纵起来舆论同样是一把好手,差点就以为他是清白的了。
4.
然后,反反反转又来了,我实在受不了了,你们自己看吧。。。
今天凌晨又出现了一个新的 Github 项目,是抨击上一次反转的,提了几个观点:他了解事情的来龙去脉,当事实习生是被冤枉的,上一个帖子看起来是GPT生成的,录音是伪造的。
到这里我的脑子已经不够用了,这场罗生门中,想要弄清楚真相太困难了,如开头所说,下午三点,宇宙厂官方看事件发酵的越来越离谱,就开始正式发布公告辟谣,从公告中,我们至少能够理清楚几个准确的信息:
首先实习生对GPU集群投毒这件事是的确发生的,事发部门是是商业化技术部门,造成的损失很大,但没有千万美元那样离谱。该实习生已经被开除,整个事件的前后,宇宙厂已经告知实习生的高校导师,同时周知了行业联盟,后者基本上堵死了该实习生在国内大厂的求职道路,这两年大模型相关岗位工资奇高,损失还是挺大的。
事情到了这里,我自己心里有一个推测,但考虑到这篇文章会被传播出去,为了减少困扰,前文只是如实记录了这起风波的过程。
当然核心点还是担心我的推测,会给相关方造成一些麻烦,还是谨慎为好,就当我写了点废话吧,如果有看法,欢迎评论区留言。
本文仅做学术分享,如有侵权,请联系删文。
3D视觉交流群,成立啦!
目前我们已经建立了3D视觉方向多个社群,包括
2D计算机视觉
、
最前沿
、
工业3D视觉
、
SLAM
、
自动驾驶
、
三维重建
、
无人机
等方向,细分群包括:
工业3D视觉
:相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。
SLAM
:视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。
自动驾驶:深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、自动驾驶综合群等、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。
三维重建
:3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等
无人机
:四旋翼建模、无人机飞控等
2D计算机视觉
:图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等
最前沿
:具身智能、大模型、Mamba、扩散模型等
除了这些,还有
求职
、
硬件选型
、
视觉产品落地、产品、行业新闻
等交流群
添加小助理: dddvision,备注:
研究方向+学校/公司+昵称
(如
3D点云+清华+小草莓
), 拉你入群。
▲长按扫码添加助理:cv3d008
3D视觉知识星球
「
3D视觉从入门到精通
」知识星球,已沉淀6年,星球内资料包括:
秘制视频课程近20门
(包括
结构光三维重建、相机标定、SLAM、深度估计、3D目标检测、3DGS顶会带读课程、三维点云
等)、
项目对接
、
3D视觉学习路线总结
、
最新顶会论文&代码
、
3D视觉行业最新模组
、
3D视觉优质源码汇总
、
书籍推荐
、
编程基础&学习工具
、
实战项目&作业
、
求职招聘&面经&面试题
等等。欢迎加入3D视觉从入门到精通知识星球,一起学习进步。