专栏名称: 程序员头条

10:24 一起看程序员热点新闻。把握行业热点，紧跟行业脚步

被字节起诉赔偿的实习生拿下行业顶会最佳论文；OpenAI正式发布 o1 完整版；人人影视公开了其全部字幕存档；字节开源代码大模型

程序员头条 · 公众号 · · 2024-12-06 10:24

正文

0、戏剧性拉满！被字节起诉赔偿800万实习生，拿下NeurIPS 2024最佳论文

时隔两个月，字节模型遭攻击事件又有新后续。今年10月份，字节商业化内部模型训练遭实习生田某攻击一事闹得满城风雨，最后田某便被开除并被要求赔偿字节的侵权损失800万元及合理支出2万元。据悉，2024年6月至7月，田某因对团队资源分配不满，通过编写、篡改代码等形式恶意攻击团队研究项目的模型训练任务，造成资源损耗。

本以为这个瓜会以字节的“雷霆手段”告一段落，没想到事件迎来了大扭转。田某和字节合作的论文被人工智能顶级会议 NIPS 被评为了 Best Paper。让田某又火了一把的 NeurIPS，是被称为「人工智能超级顶会」的存在。被认为是难度最大、水平最高、影响力最强的会议之一。

在这篇 Best Paper 中，田某和其所在团队首次提出了一种新的图像生成框架，这个框架在图像合成的质量、多样性、数据效率和推理速度方面首次超越了强大的扩散模型，并且具有很好的扩展性和零样本任务泛化能力，并且这个项目已经在Github上积累了4.4k多颗星。此外，早在2023年，田某的一项工作就曾被ICLR评选为Spotlight论文。据称这篇论文是 NeurIPS 2024 第六高分的论文 [7, 8, 8, 8]，由实习生田某某在字节商业化技术部门实习期间与团队合作发表。在这篇 Best Paper 中，田某某和其所在团队首次提出了 一种新的图像生成框架 —— VAR 。 VAR (Visual AutoRegressive modeling) 重新定义了图像上的自回归学习，将其视为从粗糙到精细的 “下一尺度预测” 或 “下一分辨率预测”。

论文 PDF 地址： https://openreview.net/attachment?id=gojL67CfS8&name=pdf

网友们也是纷纷下场吃瓜： 有人感叹：有点小说那意思了，昨日的我你爱答不理，今日的我你高攀不起。也有人劝字节及时止损，抓紧请“老师”回家。更有人支持田某直接下场创业。不过也不乏理智的网友：优秀永远也不能成为作恶的通行证。（综合自：雷峰网、OSC开源社区）

科技头条

1 、 OpenAI 正式发布 o1 完整版

OpenAI 在 12 天连续直播活动的首日发布了 o1 模型的完整版，该模型相较于之前的 o1-preview 版本在智能能力上有所提升，特别是在编程能力方面，并且能够根据问题的难度智能调节响应速度。

o1 模型完整版新增了图像识别功能，但目前仍然不支持网页浏览、文件上传等功能。OpenAI 的测试显示，o1 完整版比预览版的错误率降低了约 34%，思考速度提高了约 60%。

此外，这场直播还推出了 「ChatGPT Pro」，这是一个每月 200 美元的高级订阅服务 ，允许用户无限制使用高阶模型，包括 o1 模型的 Pro 版本，该版本能小幅提升结果的可靠性。

2、Google DeepMind 宣布大规模基础世界模型 Genie 2

Google DeepMind 宣布了一个大规模基础世界模型 Genie 2，能生成无限多种可控制动作、可玩的 3D 环境，用于训练和评估具身代理（embodied agent）。只需要向模型输入单幅的图像，它就能生成一个基于该图像的 3D 环境，用户或 AI 代理可通过键盘和鼠标输入进行游戏。Google DeepMind 称，Genie 2 可以让未来的 AI 代理在一个充满了无限可能性和探索的空间中训练和评估，为原型交互体验的全新创意工作流铺平了道路。

3、谷歌 DeepMind 推出天气预报模型「GenCast」

谷歌 DeepMind 团队推出了一款名为「GenCast」的革命性 AI 气象模型，该模型能够在短短 8 分钟内提供未来 15 天的精确天气预报，其预测准确度超越了欧洲中期天气预报中心（ECMWF）的 ENS 系统。

GenCast 是一款扩散模型，能够适应地球的球形结构，并能基于最新天气数据输入生成未来天气场景的概率分布。该模型使用 ECMWF ERA5 档案中四十年的历史气象数据进行训练，分辨率高达 0.25°。

通过使用谷歌 Cloud TPU v5 运行，GenCast 的计算速度远超传统物理模型，能在多个预测组合中提供更准确的日常天气和极端事件预测。此外，GenCast 还在预测极端天气、强风以及台风路径等方面展现了优秀的性能。

目前，谷歌已将该气象模型的代码和权重开源，以推动天气和气候研究领域的发展。此外他们还计划与更多气象社区合作，共同提升天气预报的准确性。

4、豆包 AI 文生图支持一键生成指定文本

字节跳动旗下的智能 AI 助手豆包近期升级了其文生图能力，新增了支持一键生成带有指定文本的图片的功能。

用户只需在生图提示词中加入文本要求，例如「一张带有“新年快乐”的图」，即可生成带有指定文字的图片。这一功能已经在豆包 App 中开启测试，网页及电脑版也计划在近期上线。

豆包的这一升级特别强化了汉字的生成能力，其通过打通 LLM 和 DIT 构架提升了原生中文数据的学习能力，从而解决了中文文字在图像中精准生成的难题，尤其是中文字符结构复杂且数量众多的问题。

豆包团队表示，相关功能仍在完善和优化中，尽管偶尔还会出现错字、漏字或小字乱码的情况，但绝大多数情况下能够准确生成指定文字。豆包的目标是降低创作门槛，帮助用户更好地表达和创造。

5、人人影视公开了其全部字幕存档

因被控侵犯版权遭到关闭的人人影视字幕组通过其社交媒体账号公开了全部字幕存档。存档发布在百度网盘和夸克网盘，容量不到 20GB。人人影视称：人人影视成立之初就是想把自己翻译的字幕分享给更多爱好者，历时二十年人人影视翻译了几万集的影视字幕，本着字幕组分享的宗旨，我把全部字幕文件和对应数据库打包一起分享出来给大家。有需要的请下载保存，同时还有以前我们开发的字幕软件和源码也一起打包，还有我们没来得及开发的网站设计模板和HTML页面等等。

评论区不知道让不让贴链接，我在几个主要自媒体平台的评论区都贴了链接，我们的用户名都叫：人人聊影视，大家自己找一下。至于人人影视原来的程序其实技术太老太复杂，开源出来对普通人意义不大，这里就不提供了。现在开发APP和网站比以前更方便，有多端的统一框架，也有更好的语言环境，效率更高。

百度网盘：http://t.cn/A6mSIYu6 提取码：rrys

6、亚马逊宣布了 Nova 系列 AI 模型

亚马逊在 AWS re:Invent 活动上宣布了一系列使用 Nova 品牌名称的 AI 模型：为速度和成本进行优化的文本模型 Nova Micro；低成本多模模型 Nova Lite，输入图像、视频和文本输出文本；强大的多模模型 Nova Pro；计划于 2025 年初推出的最强多模模型 Nova Premier；图像生成模型 Nova Canvas 以及视频生成模型 Nova Reel，这些模型生成的内容都会嵌入水印以促进负责任的 AI 使用。这些模型将通过 AWS Amazon Bedrock 模型库提供给客户。亚马逊还表示正与其投资的 AI 创业公司 Anthropic 合作构建庞大的 AI 计算集群。

7、乘客退机票后竟成诈骗嫌犯，涉嫌伪造病历骗取航司全额退款，平台回应：系供应商所为，已清退

据红星新闻，12月5日，有博主在社交媒体发帖吐槽，在飞猪退机票时被人利用他的身份信息伪造了病历。该网友称，去年在飞猪上付费685元购买一张机票，因临时有事在平台操作退票被扣了385元退票费，按规则这笔钱应由航司收取，约一年后网友接到警方通知，说他涉嫌伪造病历，骗取航司因病全额退款资格。博主事后联系飞猪后才查实，系第三方售票公司所为，诈骗了航司385元退票费。

12月5日，红星新闻从飞猪工作人员处获悉，经核实，这一问题是供应商违法、违规伪造证明所致，飞猪已对该供应商罚款，并于今年4月进行清退，终止一切合作。飞猪已退还消费者手续费损失、并赔偿其他损失、配合警方调查费用支出，共计8000余元，获得了消费者的谅解。飞猪称决不允许供应商从事一切伪造资料、私退私改等违规行为，发现一起严查一起。

8、明年全球云计算投资将 1.5 倍于阿波罗计划

9、Mate 70系列首销！官网售罄、门店大排长龙，华为终端BG CEO何刚线下迎客

程序员专区

1、 字节开源最全面代码大模型基准 FullStack Bench

字节跳动的豆包大模型团队与 M-A-P 开源社区合作，推出了全新的代码大模型评估基准「FullStack Bench」，它在业界首次覆盖了超过 11 类全栈编程的真实场景，并支持 16 种编程语言，包含 3374 个问题。

研究团队从全球最大的程序员技术问答社区「Stack Overflow」中随机抽取并分析了 50 万个问题，以确保其覆盖真实全栈开发中的各类应用场景。FullStack Bench 的每个问题都包含题目描述、参考解决方案及单元测试用例，总计 15168 个单元测试，由编程专家设计并经过 AI 和人工验证，以确保评估的准确性。

此外，FullStack Bench 的数据集在构建后，还根据主流代码大模型的测试结果进行了交叉评估和进一步完善，以保证问题难度、模糊性和可解性的质量。

FullStack Bench 的开源，为开发者提供了一个系统性测试大模型代码能力的有力工具，有助于更有效地评估大模型在现实世界中的代码开发能力。

2、PostgreSQL 将不再支持 MD5 密码

根据 PostgreSQL 代码仓库的最新动态，近日有维护者提交了 “弃用 MD5 密码支持” 的 commit。

该维护者指出，MD5 被认为不适合用作加密散列算法已有一段时间。此外，PostgreSQL 中的 MD5 密码散列很容易受到传递散列攻击，即知道用户名和散列密码就足以进行身份验证。v10 中添加的 SCRAM-SHA-256 方法不存在这些问题，被认为优于 MD5。

3、Meta 内部将 GPT-4 用于辅助编程

Meta 内部使用的辅助编程工具 Metamate 同时使用了 OpenAI 的 GPT-4 以及自己开发的 Llama AI。Llama 和 GPT-4 是竞争对手关系，Meta CEO 扎克伯格（Mark Zuckerberg）曾公开宣称 Llama 是领先的 AI 模型。此外扎克伯格的慈善机构 Chan Zuckerberg Initiative 正使用 OpenAI 的技术开发一款教育 AI 工具，而 OpenAI CEO Sam Altman 加入了其 AI 顾问委员会。

4、KDE 用 “弹窗” 请求捐款赢麻了：一天的收入超越前两月总和、而且没有被喷

今年 8 月底，KDE 项目开发者 Nate Graham 提交了一个 PR，希望实现一个默认启用的 KDED（KDE 守护进程）模块，目的是在 KDE Plasma 桌面的通知系统中以 “弹窗” 形式温和地请求用户向 KDE 捐赠。

KDE 项目后续合并了 Nate Graham 的 PR，并从 Plasma 6.2 开始将在桌面环境中直接请求捐款。值得注意的是，这个请求捐款的弹窗仅在每年 12 月出现。也就是说，用户会在每年的 12 月看到一次系统通知，请求向非盈利组织 KDE e.V. 捐款。