专栏名称: LLM SPACE

每周高质量AI信息

大模型日报（10月11日资讯篇）

LLM SPACE · 公众号 · 科技自媒体 · 2024-10-11 22:51

正文

我们希望能够搭建一个AI学习社群，让大家能够学习到最前沿的知识，大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区：

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」，即可在飞书每日收到《大模型日报》每日最新推送

如果想和我们空间站日报读者和创作团队有更多交流，欢迎扫码。

欢迎大家一起交流！

资讯

OpenAI：MLE-bench，衡量AI代理在机器学习工程领域表现的基准

OpenAI推出了MLE-bench，这是一个用于衡量AI代理在机器学习工程领域表现的基准。为此，工作人员从Kaggle上策划了75个与机器学习工程相关的比赛，创建了一套多样化的挑战任务，以测试现实世界中的机器学习工程技能，如模型训练、数据集准备和实验运行。

工作人员利用Kaggle公开的排行榜为每个比赛建立了人类基线并使用开源代理框架对多个前沿语言模型进行评估，发现最佳表现的设置——OpenAI的o1-preview与AIDE框架结合——在16.9%的比赛中达到了Kaggle铜奖的水平。

此外，工作人员还研究了AI代理的各种资源扩展形式及其预训练污染的影响。目前基准代码已经开源，以促进未来在理解AI代理的机器学习工程能力方面的研究。

https://openai.com/index/mle-bench/

Intel Core Ultra 200S 处理器首次亮相档 RAG

英特尔推出全新英特尔酷睿超200S系列处理器家族，将把AI PC功能拓展至桌面平台，并迎来首批发烧级桌面AI PC。

以英特尔酷睿超级 9 处理器 285K 为首，最新一代发烧级台式机处理器包括五款未锁频的台式机处理器，配备多达 8 个下一代性能核心 (P 核心)，这是台式电脑可用的最快核心1，以及多达 16 个下一代高效核心 (E 核心)，与上一代产品相比，它们的多线程工作负载性能总共提高了 14%。

新系列是首款面向发烧友推出的配备神经处理单元 (NPU) 的台式处理器，并配备内置 Xe GPU 和最先进的媒体支持。

https://www.intel.com/content/www/us/en/newsroom/news/core-ultra-200s-series-desktop.html

ApertureData为使用多模态数据的企业提供10倍的速度提升

ApertureDB将图形和矢量数据库的强大功能与多模式数据管理相结合，这有助于 AI 和数据团队以比传统方式更快的速度将他们的应用程序推向市场。

https://venturebeat.com/data-infrastructure/aperturedata-offers-10x-speed-boost-to-enterprises-using-multimodal-data/

ApertureData为使用多模态数据的企业提供10倍的速度提升

特斯拉在"We, Robot"发布会上展示了多款创新产品，核心主题是致敬艾萨克·阿西莫夫的机器人学三定律。发布会亮点集中在全自动驾驶（FSD）和全新车型Cybercab。Cybercab是一款无方向盘、踏板和后视镜的自动驾驶车，强调未来感与舒适性，目标成本为每英里0.2美元，最终售价预计低于3万美元，具备极具吸引力的市场潜力。

同时，马斯克重申了特斯拉在FSD领域的领导地位，未来的目标是在2026年实现无监督FSD上路，重点车型为Model 3和Model Y。这为特斯拉的Robotaxi计划奠定了基础，即车主在闲置时通过特斯拉平台出租车辆来获取收益。

发布会上，特斯拉还展示了Robovan，这款高密度运输车可以搭载20人，成本每英里低至5-10美分。除此之外，备受期待的人形机器人Optimus再次亮相，预计生产成本2-3万美元。马斯克计划将Optimus作为未来智能助手，广泛应用于家庭和工厂。

https://www.youtube.com/watch?v=Mu-eK72ioDk

https://mp.weixin.qq.com/s/xIWinn8G8nGWXdHSKsndCw

在2024年AMD Advancing AI大会上，AMD展示了一系列AI相关的核心产品，进一步增强了其在AI计算领域的竞争力。技术亮点包括：

旗舰AI芯片：发布的Instinct MI325X GPU采用HBM3E高带宽内存，算力高达21PFLOPS，相比英伟达H200内存容量提升1.8倍，算力提升1.3倍。AMD还展示了采用CDNA 4架构的MI350系列GPU，8卡MI355X的算力达74PFLOPS，显著超越前代产品。
服务器CPU：第五代EPYC处理器采用3/4nm工艺，最多支持192核和384线程，最高功耗达500W，性能在云计算、企业级和AI领域均有显著提升。其性能相较英特尔至强处理器提升了2.7到4倍，特别是在AI加速和HPC领域表现突出。
AI网络解决方案：AMD推出了Pensando Pollara 400 AI网卡和Salina 400 DPU，分别支持超以太网联盟（UEC）和400G吞吐量。这些网络设备显著提升了AI集群的通信效率，特别在分布式推理和训练中减少了网络延迟。
企业级AI PC处理器：第三代锐龙AI PRO 300系列处理器采用Zen 5架构，支持50-55TOPS的AI算力，专为企业AI应用设计，并支持微软Copilot+等功能。该系列在性能、效率和安全性上均有显著升级。

https://mp.weixin.qq.com/s/glLHm6f__IEESiM-lWBgnQ

推特

OpenAI分享实时API应用案例：语音绘画创作，实时语音翻译，模拟面试

我们上周在DevDay SF上宣布了实时API。看到它的广泛应用真的很令人兴奋——以下是目前我们看到的一些最酷的案例。如果有遗漏的，欢迎在这个讨论串里告诉我们！

Teledraw：结合实时语音和图像模型，用语音进行绘画创作。
Twilio实时语音翻译：通过OpenAI实时API，实现实时语音翻译功能。
模拟面试应用：使用OpenAI实时API，上传简历后进行2分钟的AI模拟面试练习。

https://x.com/OpenAIDevs/status/1844535669462323238

红杉分享 “生成式AI的第一幕”：讨论一代具有全新认知架构和用户界面的“杀手级应用”的出现

在我们关于生成式AI市场现状的最新文章中，我们将探讨基础LLM层的整合如何为扩展更高层次的推理能力和代理能力奠定基础，并讨论一代具有全新认知架构和用户界面的“杀手级应用”的出现。

https://www.sequoiacap.com/article/generative-ais-act-o1/

Sentence Transformers v3.2.0：实现了静态嵌入，速度大提升

Sentence Transformers v3.2.0 已发布，这是过去两年中最大的一次推理更新！新增了两个用于嵌入模型的后端：ONNX（+优化与量化）和OpenVINO，速度提升可达2至3倍。同时引入静态嵌入，可在精度损失10-20%的情况下实现500倍的速度提升。

https://x.com/jxmnop/status/1844068801312178199

HuggingFace评估团队分享：大语言模型评估指南

亲爱的 LLM 推特社区，我为大家制作了一本评估指南！🥳

https://github.com/huggingface/evaluation-guidebook

目标：分享 @huggingface 评估团队在管理 Open LLM 排行榜和设计 lighteval 过程中收集的实践见解和理论知识！

https://x.com/clefourrier/status/1844323838517252172

ML 曾经的Researcher Ray分享：如何明智地自学机器学习

如果你想自学机器学习并且不想浪费时间，这里有一个终极指南，因为我在这个话题上收到了很多私信：

只需回答这个问题：

你想成为一个顶尖的研究员，还是一个非常厉害的工程师？

简短总结：

工程师路径？阅读 PyTorch 文档、一本书或相关 YouTube 教程 -> 看任何“从零开始构建”的视频 -> 阅读并从零实现论文，直到你几乎不需要帮助就能做到 -> 你可能也擅长编写应用程序或网站（我一开始喜欢应用程序，然后是网站），所以用你学到的知识开始制作真正的应用，无论是为了乐趣还是赚钱 -> 拆解大公司在真实世界中如何设计他们的ML系统（通常通过博客文章）

诀窍是：广泛涉猎。精通机器学习工程的多个方面——使用Spark进行数据工程、构建模型、微调模型、设计CI/CD数据管道（你可以使用Airflow或Stepfunction等工具），理解生产中的部署流程（MLOPS），深入研究Pinterest、Google、Meta等公司的可扩展架构。

研究路径？学习微积分和线性代数的几何直觉 -> 学习概率论，特别留意符号表示，因为你会在论文中看到很多这些符号 -> 了解统计学中的经典权衡，比如偏差/方差、数据集噪声对模型的影响等 -> 通过任何教材或Andrew Ng课程或大学课程学习经典机器学习理论 -> 学习早期的深度学习作品，然后再阅读《Attention is All You Need》 -> CNN、NLP、LLM、什么都行，选择你当时觉得有趣的领域，理解论文的直觉，比如“啊，我明白为什么他们在这一步添加最终的sigmoid激活函数，因为我们在处理多类别概率问题”或者“啊，我明白为什么他们需要注意力机制，因为普通的RNN会丢失隐藏状态中的上下文”等等 -> 重复这一过程，深入探索多个深度学习主题

诀窍是：深入研究。直觉，直觉，直觉！这是我最近阅读研究论文时缺乏的，因为我更偏向工程，但如果你想成为一个顶尖的研究员，培养这种直觉非常重要！

...自处省略作者自我介绍...

我总是被问到关于“推荐什么资源”来自学机器学习的建议，老实说，答案是：其实并不重要。外面有成千上万的优秀资源，老实说，只要你知道自己想要什么，几乎随便选一个都能得到不错的效果。

不过，如果我真的要推荐一些，看看我的个人主页，我发布了很多有用的资源。特别推荐的有：

• ISL 和 ESL 统计学书籍

• Andrew Ng 的 Coursera 课程

• 100页机器学习书籍

• 《Designing Machine Learning Systems》书籍

• Pinterest在Medium上的机器学习博客

• Spark数据工程Zoomcamp

• Math Academy，满足你所有的数学需求

• Karpathy的“从零到英雄”系列 https://karpathy.ai/zero-to-hero.html

你得意识到每天的时间有限，如果你在兼顾日常工作、健身、家庭，甚至孩子，那么最好选择适合的学习内容，以节省你的时间。

再读一遍上面的总结，选择你的冒险！如果选对了适合你的路径，前方将会非常有趣！

此处省略作者自我介绍

https://x.com/yoobinray/status/1844460463670886902

产品

JobJump

AnonAI 是一种保护用户隐私的匿名聊天工具，利用人工智能技术进行自然语言处理，允许用户在不透露个人身份的情况下进行交流和互动。

https://jobjump.teameet.cc/

AnonAI

AnonAI 是一种保护用户隐私的匿名聊天工具，利用人工智能技术进行自然语言处理，允许用户在不透露个人身份的情况下进行交流和互动。

https://www.autonomous.ai/

投融资

Numeric完成2800万美元A轮融资，用AI自动化会计流程

Numeric是一家旨在通过AI自动化会计流程的软件公司。公司由Parker Gilbert联合创立，他在2020年受够了在初创企业处理财务和会计的繁琐工作，因此决定开发一种能自动化月末和季度末关账流程的解决方案。Numeric的AI功能可以显著减少人工操作，帮助会计团队节省大量时间，目前其客户包括Brex、OpenAI、Plaid和Wealthfront等知名公司。

仅在完成1000万美元的种子轮融资五个月后，Numeric便在由Menlo Ventures领投的A轮融资中获得了2800万美元。参与投资的新投资者包括IVP和Socii，而Founders Fund、Long Journey、8VC等早期投资者也继续支持本轮融资。这使Numeric的总融资额进一步增加，展示出投资者对AI自动化会计市场的高度认可。

Numeric的产品通过聚合和对账来自多个会计系统和Excel电子表格的数据，并利用AI代理检查每个项目与前一个月的变化情况，帮助会计师更快速地进行差异分析。此外，Numeric计划进一步扩展产品功能，包括进入财务规划与分析市场。

公司官网：https://www.numeric.io/

https://techcrunch.com/2024/10/10/numeric-grabs-28m-series-a-for-automating-accounting-with-ai/

Relyance完成3200万美元B轮融资以帮助企业遵守数据法规

Relyance是一家帮助企业确保其数据使用符合全球法规的平台公司。随着AI需求的增长，企业对数据安全的关注也日益增加。为了应对这一需求，Relyance开发了一套工具，帮助企业确保数据处理过程符合法规要求。该公司由Abhi Sharma和Leila Golchehreh共同创立，Sharma具有软件开发背景，而Golchehreh则是一名曾在Workday和自动驾驶公司Cruise工作的资深法律顾问。

在最新一轮B轮融资中，Relyance成功筹集了3200万美元，由Thomvest领投，参与方包括微软的风险投资基金M12、Cheyenne Ventures、Menlo Ventures和Unusual Ventures。这轮融资使Relyance的总融资额达到5900万美元。公司计划利用这笔资金扩展团队规模，到年底增加到90名员工，主要扩展工程团队和市场推广能力，以支持产品开发和增长势头。

融资背景凸显了AI需求的增长以及全球隐私和AI法规的持续实施，Relyance正积极应对这一趋势，通过技术和合规工具帮助企业降低数据处理中的风险。

公司官网：https://www.relyance.ai/

https://techcrunch.com/2024/10/10/relyance-helps-companies-comply-with-data-regulations/

推荐阅读

大模型日报（10月11日资讯篇）

正文

资讯

OpenAI：MLE-bench，衡量AI代理在机器学习工程领域表现的基准

Intel Core Ultra 200S 处理器首次亮相档 RAG

ApertureData为使用多模态数据的企业提供10倍的速度提升

ApertureData为使用多模态数据的企业提供10倍的速度提升