专栏名称: APPSO
让智能手机更好用的秘密。
目录
相关文章推荐
APPSO  ·  DeepSeek 被误读的 5 ... ·  22 小时前  
小众软件  ·  RMVA 在 Steam ... ·  昨天  
APPSO  ·  刚刚,OpenAI 再出招反击 ... ·  3 天前  
小众软件  ·  用空气传输文件 · 续 ·  3 天前  
APPSO  ·  DeepSeek ... ·  5 天前  
51好读  ›  专栏  ›  APPSO

爆火国产AI自称是GPT-4,奥特曼疑暗讽/OpenAI重组遭围攻/马斯克:AI智力或2027年超人类|Hunt Good周报

APPSO  · 公众号  · app  · 2024-12-29 11:58

正文

欢迎收看最新一期的 Hunt Good 周报!
在本期内容你会看到:
8 条新鲜资讯
3 个有用工具
1 个有趣案例
4 个鲜明观点
Hunt for News|先进头条
👀 DeepSeek V3 自称是 GPT-4,Sam Altman 疑似发文暗讽
近期,国产大模型厂商 DeepSeek 发布了新一代开源 AI 模型 DeepSeek V3。
但据多位网友以及媒体测试发现,当被询问身份时,DeepSeek V3 偶尔会自称是 GPT-4,甚至在回答 API 相关问题时也会直接提供 OpenAI 的 API 使用说明。
并且,测试发现它连讲的笑话都与 GPT-4 一字不差。

外媒 Techcrunch 援引 AI 研究员迈克·库克的说法指出,这种现象可能源于训练数据中包含了大量 ChatGPT 的输出内容。
「这就像复印件的复印件,我们在这个过程中逐渐失去了与现实的联系,」他解释道。这种做法不仅可能违反 OpenAI 的服务条款,还会导致模型产生「幻觉」和误导性回答。
不过,这种现象并非 DeepSeek 独有,Google Gemini 也曾出现类似情况。
有观点认为,DeepSeek V3 的这种表现可能源于两个原因:一是训练数据中可能包含了 GPT-4 的问答数据,亦或者 GPT-4 生成的互联网内容对训练数据造成了一定程度的「污染」。
另外,不少网友指出,OpenAI CEO Sam Altman 疑似在 X 平台发文内涵:
复制你知道有效的东西(相对)容易。当你不知道它是否会奏效时,做一些新的、有风险的和困难的事情是非常困难的。
截至发稿前,DeepSeek 和 OpenAI 均未对此事作出正式回应。
🔗 https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/
🤖 机器人/狗爆火,多项产品亮相
停摆 4 年后,OpenAI 被曝重启人形机器人研发计划。
与此同时,波士顿动力公司和中国宇树科技近期发布的机器人/狗演示视频,吸引了全球目光。
在液压 Atlas 退役后,波士顿动力的新一代电动 Atlas 以一身圣诞老人装扮亮相,再次完成后空翻动作,让人不禁想起 2017 年液压版 Atlas 的经典一跃。
宇树科技 Unitree B2-W 工业轮足也在发布量产一年后迎来「天赋觉醒」。
它不仅能够灵活运用四足、双足、单足多种模式完成 360 度旋转跳跃,还能以流畅的侧空翻姿态跨越障碍物,既能翻山下坡,也能穿水渡河。
随后,英伟达高级科学家 Jim Fan 转发上述两则视频表示:
这些不是 CGI。
强化学习(RL)又回来了。当对字符串进行操作时,它会给我们 o3。
当在物理电机上操作时,它为我们提供了一个完美的人形后空翻以及一个可以胜过地球上几乎所有动物的机器人生物。RL 是唯一可以同时掌握比特世界和原子世界的学习算法之一。
「给我一个奖励函数,我就能撬动整个世界。」
2025 年,RL 的时代。
🔗 https://x.com/DrJimFan/status/1871243375103623208
😡 OpenAI 重组计划遭围攻,前高管也看不下去了
12 月 27 日,OpenAI 突然宣布,将计划从营利性公司转变为特拉华州公共利益公司(PBC)。
据悉,PBC(公共利益公司)是一种特殊的营利性公司形式,要求公司在决策时平衡股东利益、利益相关者利益以及公共利益。
目前,OpenAI 希望既要守住非营利的初心,也要在商业竞争中更好地生存。而这种结构也将帮助 OpenAI 筹集到更多开发 AI 模型的资金。
OpenAI 在 X 平台发文强调:
OpenAI 的董事会正在评估我们的公司结构,其目标是建立一个由营利公司成功支持的更强大的非营利组织。我们的计划将打造历史上资源最充足的非营利组织之一。
不过,OpenAI 的重组计划引发广泛争议,不仅遭到网友的一片质疑,多位 OpenAI 前高管也相继对这一计划提出批评。
前 AI 政策主管 Miles Brundage 表示,该重组提案中存在多个「危险信号」,特别是在公司治理方面仍有诸多关键问题尚不明晰。
他还特别指出,资金充裕的非营利部门可能会给公益企业部门(PBC)带来过多自主权,使其偏离初衷,逐渐演变为一家普通的商业公司。
他强调,在产品开发决策方面,包括定价策略和安全措施等,都必须确保非营利组织的原始使命始终处于优先地位。
今年 5 月转投 Anthropic 的 Jan Leike 也对这次重组计划提出质疑。
他指出,OpenAI 正逐渐偏离「确保通用人工智能造福全人类」的初衷,转而投入医疗、教育和科学等领域的小规模慈善计划。
这完全不是我当初加入 OpenAI 时所期待的,非营利组织必须坚守 OpenAI 的使命!
值得一提的是,非营利组织 Encode 于当地时间周五向加州北区地方法院提交法庭之友(Friend of the court)简报,声援马斯克阻止 OpenAI 向营利性公司转型的诉讼。
Encode 的律师在简报中指出,OpenAI 转变为营利性机构将严重损害该公司成立的初衷。同时,该简报还强调:
如果世界真的即将进入通用人工智能(AGI)新时代,那么由一个在法律上必须优先考虑公共安全和利益的慈善机构来掌控这项技术,远比交给一个专注于为少数特权投资者创造利润的组织更符合公众利益。
🔗 https://techcrunch.com/2024/12/27/nonprofit-group-joins-elon-musks-effort-to-block-openais-for-profit-transition/
👟 传耐克试水 AI 广告
继麦当劳、可口可乐之后,耐克也疑似推出全新的 AI 生成广告。
网友 @jakbannon 发文称:
@GibsonHazard 执导了最新的 Travis Scott X Nike 广告,在前期制作期间,我在 MidJourney 上生成了超过 5000 张图像,与 Gibson 一起制作视觉识别。


🔗 https://x.com/jakbannon/status/1872313100931940475
🕯️ OpenAI 回应吹哨人去世事件
12 月 27 日,OpenAI 通过社交平台对前员工 Suchir Balaji 去世一事作出回应。
OpenAI 官方表示对这一悲痛消息深感震惊,并称已经与 Suchir 的家人取得联系,承诺在这一困难时期提供全力支持。
同时,OpenAI 表示在纽约时报发表 Suchir 的个人评论之后,他们并未与 Suchir 有任何进一步接触和来往。
原声明如下:
我们得知这一悲痛的消息后感到极其震惊,并已与 Suchir 的家人取得联系,以在这段艰难时期向他们提供全力支持。我们的首要任务是继续尽我们所能帮助他们。
Suchir 是我们团队中一位备受重视的成员,他的离世对与他密切合作的同事产生了深深的影响。
我们首次了解到他的担忧是在《纽约时报》发表了他的评论之后,我们没有任何记录显示与他有进一步的互动。我们尊重他和其他人自由表达观点的权利。
我们的心与 Suchir 的亲人同在,并向所有哀悼他逝世的人致以最深切的慰问。
此前,Suchir Balaji 接受纽约时报采访时,举报 OpenAI 可能违反版权法。此后,纽约时报于 11 月对 OpenAI 正式提起版权侵权诉讼时,Suchir 被认定是「掌握关键证据」的人。
然而,11 月 26 日,Suchir Balaji 在其旧金山公寓中被发现死亡。
此外,外媒 Business Insider 也公布了对 Suchir 母亲 Poornima Ramarao 的独家采访。Suchir 的父母悲痛表示,对于儿子之死,希望官方继续展开调查。
🔗 https://www.businessinsider.com/suchir-balaji-openai-mom-death-concerns-interview-2024-12
👀 英伟达「显卡大礼包」遭曝光
近日,多家媒体曝光了英伟达多款产品信息,其中包含专为 o1 推理大模型打造的 GPU 全新 B300,和万众瞩目的 RTX5090。
据 SemiAnalysis 报道,全新的 B300 将采用与 B200 同样的台积电 4NP,但将是全新流片。
功率方面,GB300 和 B300 HGX 的 TDP 分别达到 1.4KW 和 1.2KW,相比 B200 系列分别提高 0.2KW,同时架构也迎来创新,将会在 CPU 与 GPU 之间进行动态分配功率。
B300 系列还将升级显存,将升级到 12 层的 12-Hi HBM3E,显存容量升级为 288GB,显存带宽仍为 8TB/s。
据 SemiAnalysis 透露,GB300 系列的交付也有所不同。
此前,GB200 系列提供整个 Bianca Board,其中包括两颗 GPU、一颗 CPU、CPU 的内存等所有组件都集成在一块 PCB 板上。
本次 GB300 系列则只提供 Reference Board,其中包括两颗 B300 GPU、一颗 Grace CPU、HMC(Hybrid Memory Cube),而 LPCAMM 内存模块等组件将由客户自行采购。
报道称,这也将给 OEM 和 ODM 厂商带来新的方向与机会。
本次 B300 系列还将为推理大模型而打造。据悉,显存的升级对 OpenAI o1/o3 一类的推理大模型至关重要,因为推理思维链长度会增加 KVCache,影响 batch size 和延迟。
本次 B300 的显存升级后,将带来这些提升:

实现更长的思维链

每个思维链的延迟更低

降低推理成本

处理同一问题时,可以搜索更多样本,最终提高模型能力
近日,英伟达消费级显卡 RTX5090 的 PCB 也首次曝光。
据了解,曝光的 PCB 板上没有印刷「NVIDIA」标识,因此有推测其为非公版 RTX5090 的 PCB 板,但仍能分析出部分 RTX5090 的参数。
从目前曝光信息来看,RTX5090 所使用的 GB202 GPU 芯片,封装面积达 3628 平方毫米,实际的核心面积达 744 平方毫米,尺寸巨大;同时 RTX5090 将配备 16 颗显存芯片,若单颗容量 2GB GDDR7,总计将达 32GB 显存。
同时,RTX5090 的 GPU 核心照也遭曝光。据分析,RTX5090 完整的核心编号为 GB202-300-A1,与传闻相符。
此外,RTX 5080、RTX 5070 Ti 则会改用次一级的 GB203 芯片;RTX 5070、RTX 5060 Ti 为 GB205;最低为 RTX 5060 的 GB206。
🔗 https://x.com/mark\_k/status/1871864813913330003
🔍 ChatGPT AI 搜索被曝存在安全问题
近日,据英国卫报报道,ChatGPT AI 搜索功能存在严重安全隐患,可能容易受到隐藏内容的操纵。
调查人员通过测试发现,当要求 ChatGPT 总结包含隐藏内容的网页时,这些隐藏内容可能包含第三方指令,从而改变 ChatGPT 的响应,这种技术被称为「提示注入」。
此外,隐藏内容还可能包含大量文本来影响 ChatGPT 的判断,比如夸大产品或服务的优点。
例如,在测试中,研究人员创建了一个虚假的相机产品页面。当页面中包含指示 ChatGPT 返回好评的隐藏文本时,即使页面上存在负面评论,ChatGPT 仍会给出完全正面的评价。
CyberCX 的网络安全研究员雅各布·拉森认为,如果当前版本的 ChatGPT AI 搜索功能全量发布,可能会导致大量专门用于欺骗用户的网站出现。
🔗 https://www.theguardian.com/technology/2024/dec/24/chatgpt-search-tool-vulnerable-to-manipulation-and-deception-tests-show
💰 马斯克 xAI 官宣完成 60 亿美元融资
北京时间 12 月 24 日,xAI 在社交平台发文,宣布已经完成了 60 亿美元融资。
这次融资的主要投资者包括 A16Z、Blackrock、Fidelity Management & Research Company 等,英伟达和 AMD 也参与本轮融资。
在官网的文章中,xAI 表示,此轮融资的资金将用于进一步加速其基础设施,推出将被数十亿人使用的开创性产品,并加速未来技术的研发。
早在今年 11 月, xAI 获得 50 亿美元融资,当时公司估值达到 500 亿美元,参与此轮融资的投资者包括卡塔尔投资局、Valor Equity Partners、红杉资本和 Andreessen Horowitz。
值得一提的是,随后马斯克转发平台推文称:「A lot of compute is needed 需要大量的计算资源」,而 OpenAI 总裁 Greg Brockman 也现身评论区道「恭喜」。
🔗 https://t.co/ilzwRAeh5R
Hunt for Tools|先进工具
🎨 可灵 1.5 推出「AI 模特」功能
12 月 27 日,可灵 AI 发文宣布为大家带来可图 1.5 图像模型多项功能,具体功能如下:

AI 试衣新增「AI 模特」功能:在输入文本描述即可生成 AI 模特,配合 AI 换装及可灵 1.6 图生视频,轻松 get 服装展示视频

可灵 1.5 模型支持「尾帧生成」

对口型功能新增 10 款高品质音色
此前,可灵 AI 于今年 11 月上线了「AI 试衣」功能。
官方介绍,最少只需两张图就可以解锁「AI 试衣」功能,用户只需上传上衣和下衣(或选择套装/连衣裙),选择完成模型照片后,便可生成模特试衣视频。
👏 通义全新推理模型 QVQ 宣布开源
12 月 25 日,通义千问宣布,基于 Qwen2-VL-72B 构建的开源多模态推理模型 QVQ 开源。
据官方介绍,QVQ 在人工智能的视觉理解和复杂问题解决能力方面实现了重大突破。在 MMMU 评测中,QVQ 取得了 70.3 的优异成绩,并且在各项数学相关基准测试中相比 Qwen2-VL-72B-Instruct 都有显著提升。

通过细致的逐步推理,QVQ 在视觉推理任务中展现出增强的能力,尤其在需要复杂分析思维的领域表现出色。
官方表示,尽管 QVQ 的表现超出了预期,但仍会出现一些局限:

语言混合与切换:模型可能会意外地混合语言或在语言之间切换,从而影响响应的清晰度;

递归推理:模型可能会陷入循环逻辑模式,产生冗长的响应而无法得出结论;

安全和伦理考虑:模型需要增强安全措施,以确保可靠和安全的性能,用户在部署时应保持谨慎;

性能和基准限制:尽管模型在视觉推理方面有所改善,但它无法完全替代 Qwen2-VL-72B 的能力。此外,在多步骤视觉推理过程中,模型可能会逐渐失去对图像内容的关注,导致幻觉。
目前,QVQ 模型已在魔搭社区和 HuggingFace 等平台上开源。
🔗 https://mp.weixin.qq.com/s/hHAV2Hdl4iYBqkZxYtsxtQ
✊ 打造下一个英伟达,软银芯片计划曝光
近日,据彭博社披露,软银集团创始人孙正义正积极布局 AI 芯片领域,力图打造一家能够与英伟达比肩的芯片企业。
根据规划,软银预计将于 2026 年推出首批可供销售的 AI 芯片,并有望最早在明年夏季完成原型产品开发。
据悉,在技术层面,孙正义将着重关注 AI 领域的能源效率问题。
他期望 ARM 能在 AI 芯片开发中发挥关键作用,并已将台积电列为潜在的生产合作伙伴。据了解,孙正义目前正与 ARM CEO 雷内·哈斯密切协作推进这一计划。
虽然双方在某些具体问题上存在分歧,但都对 AI 芯片市场前景持乐观态度。
此外,软银近期收购的英国 AI 芯片制造商 Graphcore 也将为该项目提供技术支持。而该公司此前也一直以开发高性能 AI 处理器著称。
🔗 https://www.bloomberg.com/news/features/2024-12-22/masayoshi-son-s-100-billion-ai-gamble-to-become-the-next-nvidia?srnd=phx-technology
Hunt for Fun|先行
OpenAI o3 聊天记录生成器走红

o3 至少要到明年 1 月份才能用上,但用它来编造聊天记录的生成器却开始走红。

你知道的,有聊天记录,这下子真的不能不信了。

我们跟风试了试。

向左滑动查看更多内容

附上体验地址:





请到「今天看啥」查看全文