南方都市报消息称,字节跳动起诉前实习生田某某篡改代码攻击公司内部模型训练一案,已获北京市海淀区人民法院正式受理,案由为侵权责任纠纷。字节跳动请求法院,判令田某某赔偿公司侵权损失 800 万元及合理支出 2 万元,并公开赔礼道歉。2024 年 10 月,有媒体称“字节大模型训练任务被实习生攻击”,并有网传信息称“涉及 8000 多卡、损失上千万美元”。后字节跳动通过官方账号发布事实澄清,称确有实习生发生严重违纪,涉事实习生已于 2024 年 8 月被公司辞退。
上述澄清公告还指出,此次涉事行为恶意干扰字节跳动商业化技术团队某研究项目的模型训练任务,并不影响公司的正式项目及线上业务,也不涉及字节跳动大模型等其他业务。至于“涉及 8000 多卡、损失上千万美元”的传闻,则属严重夸大。
按照网传说法,前实习生田某某行为包括但不限于:
1 修改集群pytorch源码,包括随机种子,优化器,数据加载
2 随机kill 多机实验进程,导致大卡实验卡死
3 通过checkpoint打开登陆后门,自动发起攻击随机停止进程
4 参加集群故障排查日会,根据同事排查思路持续定向修改攻击代码
5 修改同事模型权重,造成实验结果无法复现
11 月 5 日,字节跳动内部发布的年内第四份《企业纪律与职业道德委员会通报》进一步披露了这起事件的相关细节。
通报指出,2024 年 6 月至 7 月,集团商业产品与技术部门前实习员工田某某,因对团队资源分配不满,通过编写、篡改代码等形式恶意攻击团队研究项目的模型训练任务,造成资源损耗。公司已与其解除实习协议,同步阳光诚信联盟及企业反舞弊联盟,并同步至其就读学校处理。
公开信息显示,田某某本科毕业于北京航空航天大学软件学院,研究生就读于北京大学,研究兴趣为深度学习的优化与算法。自 2019 年起,他在商汤和字节跳动实习研究,具体包括超参数优化、强化学习算法、自监督的新型算法。
为何选择在此时发起诉讼?
据字节跳动内部人士介绍,由于田某某为在读博士,公司将其辞退后首先交由校方处理。但在事件处理期间,田某某多次对外否认,称攻击模型训练任务的不是自己,而是别的实习生。考虑到田某某完全没有意识到错误,且涉事行为已触犯公司安全红线,公司最终决定向法院起诉,以表明公司严肃态度、杜绝类似事件再次发生。
如何看待这一索赔金额?上海大邦律师事务所高级合伙人游云庭告诉南都记者,索赔金额的高低,关键在于其是否合理。如果字节跳动能够提供证据,证明对方故意篡改代码导致相应损失,那么即使索赔 800 万,也不能视为过高。
他认为,“索赔金额可能只是覆盖了直接损失,例如浪费的算力和电力成本;而间接损失,如因人工智能训练未达预期而错失的业务机会、人力成本的浪费等,可能并未包含在内。”
据游云庭分析,如果田某某是作为在校学生去实习,他与字节跳动之间的法律关系可能是劳务关系或者非劳动关系的其他民事关系。在这种情况下,如果田某某故意破坏了人工智能的训练过程,这可能构成对劳务合同或实习合同的违约。
游云庭还提到,如果此事确实造成巨大损失,田某某涉嫌毁坏财物罪或者破坏生产经营罪,那么作为被害人的字节跳动可以追究实习员工刑事责任。
https://www.zhihu.com/question/5308895035
https://github.com/JusticeFighterDance/JusticeFighter110
https://www.weibo.com/ttarticle/p/show?id=2309405105609744973907