专栏名称: AI算法与图像处理
考研逆袭985,非科班跨行AI,目前从事计算机视觉的工业和商业相关应用的工作。分享最新最前沿的科技,共同分享宝贵的资源资料,这里有机器学习,计算机视觉,Python等技术实战分享,也有考研,转行IT经验交流心得
目录
相关文章推荐
大众新闻-大众日报  ·  消息传来,他已获中国国籍! ·  21 小时前  
大众新闻-大众日报  ·  消息传来,他已获中国国籍! ·  21 小时前  
川观新闻  ·  编制内!成都事业单位公开招聘,正在报名→ ·  23 小时前  
成都本地宝  ·  成都出发坐高铁去看海的6个城市推荐! ·  4 天前  
成都发布  ·  国家出手教减肥!四川人应该这么吃→ ·  3 天前  
51好读  ›  专栏  ›  AI算法与图像处理

姚班天才创办的大模型公司,卖了

AI算法与图像处理  · 公众号  ·  · 2025-03-02 21:40

正文


白交 发自 凹非寺
量子位 | 公众号 QbitAI

最新消息,斯隆奖得主、姚班校友马腾宇大模型创业成果,被收购!

收购方是MongoDB,一家开源数据库上市龙头。

而距离他2023年11月官宣 创业Voyage AI不到一年半的时间 。当时创业阵容十分之瞩目和豪华,李飞飞曼宁等大佬担任顾问。

他们主要是做针对RAG(检索增强生成)专门优化的嵌入模型,为智能 AI 应用程序提供支持。

在这短短一年多时间里,模型更新到了第三个版本,实现了最先进的检索精度和向量存储成本的大幅降低;期间完成了两轮融资,总筹集金额达到2800万美元。

此次收购,具体金额还未透露。

但在马腾宇公司博客中透露了他们选择被MongoDB收购的原因。

简单来说就是,两者强强联合,将AI检索模型直接引入数据库,在更统一的堆栈下带来更高效的开发体验,还能提高AI应用程序的性能和准确性。

不少业内人士,在马腾宇推文底下表示了祝贺。

5年时间做出SOTA嵌入模型

当初创业时,他们曾透露一个重要的创业原因是认为业界对嵌入模型的重视程度远远不够。

嵌入模型与生成式模型有一定相似之处,但更加侧重于语义理解,通过神经网络(通常是Transformer)架构来对语义上下文进行捕获和压缩。

难度上,训练嵌入模型和生成式模型一样困难——训练高质量的嵌入模型需要在架构、数据、损失函数等许多方面进行反复实验。

于是,他们用了5年时间,收集了海量训练数据和预/后处理方法,最终打造出了一款SOTA的嵌入模型。

而在创业之后,模型的迭代还在继续。

Voyage发布了诸多系列模型,包括通用嵌入模型、代码检索嵌入模型、多模态嵌入模型,他们都在过去三个月期间都纷纷升级到了第三个版本。

通用和多语言嵌入模型voyage-3-large :该模型在涵盖 100 个数据集的八个评估领域中排名第一,包括法律、金融和代码,上下文长度为32K。通过俄罗斯套娃表征学习 (MRL) 和量化感知训练,支持更小的尺寸和 int8 和二进制量化,可显着降低 vectorDB 成本,同时对检索质量的影响最小。

基于代码检索的嵌入模型voyage-code-3 。在一组32个代码检索数据集上,它的性能分别比 OpenAI-v3-large 和 CodeSage-large 平均高出 13.80%和16.81%。通过使用 Matryoshka 学习和量化格式(如 int8 和二进制格式)支持更小的维度,voyage-code-3 还能显著降低存储和搜索成本,同时将对检索质量的影响降至最低。

多模态嵌入模型voyage-multimodal-3 ,可用于包含丰富视觉和文本的文档。与现有的多模态嵌入模型不同,voyage-multimodal-3 能够对交错文本和图像进行矢量化处理,并从 PDF、幻灯片、表格、数字等截图中捕捉关键视觉特征,从而省去了复杂的文档解析过程。在对 3 个多模态检索任务(共 20 个数据集)进行评估时,voyage-multimodal-3 比性能仅次于它的多模态嵌入模型平均提高了 19.63% 的检索准确率。

与此同时,还积累了一众顶尖的合作伙伴,包括AWS、Databricks、Anthropic、Harvry、LangChain、Replit等等知名公司。

此次收购之后,Voyage AI可以MongDB带来什么?

用一张图就可以概括之。







请到「今天看啥」查看全文