专栏名称: AI科技大本营
为AI领域从业者提供人工智能领域热点报道和海量重磅访谈;面向技术人员,提供AI技术领域前沿研究进展和技术成长路线;面向垂直企业,实现行业应用与技术创新的对接。全方位触及人工智能时代,连接AI技术的创造者和使用者。
目录
相关文章推荐
湖南日报  ·  拟录用本科生惹争议,删除公示名单?国企回应 ·  15 小时前  
湖南日报  ·  邓正安被查 ·  19 小时前  
湖南日报  ·  特斯拉,突发! ·  昨天  
湖南日报  ·  一本族谱+一杯芝麻豆子茶+?=“靶材之王” ·  2 天前  
湖南建设投资集团有限责任公司  ·  风采展示 | ... ·  2 天前  
51好读  ›  专栏  ›  AI科技大本营

“世界顶级开源模型”被指欺诈;苹果智能测试时频发错误 | AI头条

AI科技大本营  · 公众号  ·  · 2024-09-10 10:10

正文

整理 | 王启隆
出品 | AI 科技大本营(ID:rgznai100)

一分钟速览新闻点!
  • iPhone 16 推出,苹果智能软件引关注

  • xAI 与特斯拉已达成未来收入分成协议,用 AI 技术换取特斯拉软件收入

  • 开源 AI 模型 Reflection 70B 性能遭质疑,被指欺诈

  • Open Interpreter 放弃 01 Light 硬件转推 01 App

  • Hugging Face 推出 LightEval 解决 AI 责任问题

  • 文心一言市场负责人否认放弃通用大模型

  • 《人工智能安全治理框架》发布

国内外 AI 要闻

iPhone 16 推出,苹果智能软件引关注

苹果公司今日亮相 iPhone 16,将于 9 月 20 日发布,其 A18 芯片搭载的 “专为苹果智能设计” 的软件成为焦点。该软件能总结信息、写邮件、清理照片等,但在测试中出现诸多问题,如错误信息、编造内容、错误解释文本含义、颠倒人名等,还会把诈骗信息放入 “优先” 收件箱,甚至对图像进行不当编辑。苹果表示正在努力提高其准确性,但目前该软件仍未完成,对于考虑购买 iPhone 16 的人来说,需等待苹果智能找到有用和无意义之间的正确平衡,并了解其对电池寿命的影响。苹果智能在将人工智能引入大众消费产品方面有一定潜力,但也面临挑战,购买需谨慎。

xAI 与特斯拉已达成未来收入分成协议,用 AI 技术换取特斯拉软件收入

埃隆・马斯克的人工智能初创公司 xAI 正与特斯拉商讨一项交易,根据提议,特斯拉可能将部分收入分给 xAI 以换取 xAI 的技术和资源访问权。特斯拉拟授权 xAI 的人工智能模型用于其自动驾驶辅助软件 Full Self - Driving 并让 xAI 协助开发如电动汽车语音助手、人形机器人 Optimus 软件等其他功能,交易条款取决于特斯拉对 xAI 技术的依赖程度。不过马斯克在相关报道发布后否认了这一内容。

马斯克将特斯拉未来押注在机器人技术和人工智能上,其 FSD 服务有收费模式且在开发机器人出租车。若正式合作可能引发利益冲突担忧,已有股东提起诉讼。xAI 从特斯拉雇佣员工,马斯克曾转移硬件资源,xAI 称是特斯拉软件产品关键技术提供商。xAI 今年 5 月获高额融资并推出数据中心,同时特斯拉也在大力投资建设数据中心,目前不清楚与 xAI 的交易对特斯拉支出的影响,且特斯拉在电动汽车市场竞争加剧下销售和利润有所下降。

开源 AI 模型 Reflection 70B 性能遭质疑,被指欺诈

9 月 6 日,纽约初创公司 HyperWrite 的 CEO Matt Shumer 在 X 上宣布 Reflection 70B 是 “世界顶级开源模型”,它是基于 Meta 的 Llama 3.1 或 Llama 3 变体并采用 “Reflection Tuning” 技术。但 9 月 7 日,Artificial Analysis 分析称其 MMLU 分数与 Llama 3 70B 相同且低于 Meta 的 Llama 3.1 70B,Shumer 称模型上传到 Hugging Face 时权重有问题。

9 月 8 日,Artificial Analysis 通过私人 API 测试发现虽有表现但未达最初声称水平,并提出质疑,同时 Reddit 社区用户也对 Reflection 70B 的性能和起源表示质疑,有人指责 Shumer 欺诈,也有人为其辩护,目前 AI 研究社区都在等待 Shumer 的回应以及更新的模型权重。

Open Interpreter 放弃 01 Light 硬件转推 01 App

Open Interpreter 团队做出重要决定,放弃制造 01 Light 硬件设备而推出 01 App。该应用能运行在各种硬件上且可通过语音控制操作设备,用户可按住按钮语音输入远程控制计算机(如 Mac、Windows、Linux 操作系统设备),其具有上下文积累能力,在语音按钮未按下时可累积信息以更好地理解用户指令意图提升准确性。此外,01 App 完全开源,制造材料与开发文档向公众开放,而且它 支持多个平台开发,提供包含 React、JS、Unity、Swift、iOS、Android、Flutter、Rust、Next.js 等在内的 SDK 供开发者使用,方便开发者快速构建和集成应用功能。

Hugging Face 推出 LightEval 解决 AI 责任问题

Hugging Face 近日推出轻量级评估套件 LightEval,以帮助企业和研究人员评估大型语言模型。评估在 AI 发展中至关重要,而 LightEval 作为可定制的开源评估套件,能与 Hugging Face 现有工具无缝集成,支持多种设备,具有用户友好性和高级评估配置等特点。它填补了 AI 生态系统中评估工具的空白,推动了开源 AI 在企业创新中的发展,但也面临管理复杂性等挑战。随着 AI 发展,对可靠、可定制评估工具的需求将增长,LightEval 机遇巨大,为 AI 评估设定了新标准,对确保 AI 系统可靠、公平和有效至关重要。







请到「今天看啥」查看全文


推荐文章
湖南日报  ·  邓正安被查
19 小时前
湖南日报  ·  特斯拉,突发!
昨天
湖南建设投资集团有限责任公司  ·  风采展示 | 集团劳动模范:王群英、谭勇、熊先勇、刘军
2 天前
金乡大蒜辣椒国际交易市场  ·  春季这样施肥最有效:农业部发布最权威施肥指导
7 年前
Kris在路上  ·  测测你的艺术品位有多高?
7 年前