专栏名称: 机器之心SOTA模型
追踪 AI 开源进展,探索先进开发实践。
目录
相关文章推荐
海峡导报  ·  雷军升任中国新首富?最新回应 ·  8 小时前  
海峡导报  ·  雷军升任中国新首富?最新回应 ·  8 小时前  
安徽省教育厅官微  ·  合肥城市学院:以影为媒 ... ·  15 小时前  
安徽省教育厅官微  ·  合肥城市学院:以影为媒 ... ·  15 小时前  
云头版  ·  一周两个央企大单!中国移动成为部署DeepS ... ·  17 小时前  
云头版  ·  一周两个央企大单!中国移动成为部署DeepS ... ·  17 小时前  
科大烽火  ·  F-35刚起飞,中国在2000公里外识破,美 ... ·  昨天  
科大烽火  ·  F-35刚起飞,中国在2000公里外识破,美 ... ·  昨天  
51好读  ›  专栏  ›  机器之心SOTA模型

今日开源(2025-02-25):TinyR1-Preview,32B推理模型,数学表现超越70B模型,5%参数接近完整R1性能

机器之心SOTA模型  · 公众号  · 科技自媒体  · 2025-02-25 18:09

正文


🏆基座模型

①项目:TinyR1-Preview

★Tiny-R1-32B-Preview 是北京奇虎科技有限公司推出的第一代推理模型。 该模型在数学领域的表现超过了70B模型 Deepseek-R1-Distill-Llama-70B,并且在参数仅为5%的情况下,几乎达到了完整R1模型的性能。 项目通过在数学、编码和科学三个目标领域进行监督微调,结合多个领域的专用模型 ,最终使用合并工具创建了Tiny-R1-32B-Preview,展示了强大的整体性能。

☆一键收藏:

https://sota.jiqizhixin.com/project/tinyr1-preview


🛠️框架平台、必备工具

①项目:DeepEP

DeepEP 是一个专为专家并行(EP)和专家混合(MoE)设计的高效通信库。它提供高吞吐量和低延迟的全对全 GPU 内核,支持低精度操作如 FP8。 该库优化了非对称域带宽转发,适用于训练和推理任务,并引入了基于钩子的通信计算重叠方法,以减少延迟。

☆一键收藏:

https://sota.jiqizhixin.com/project/deepep


②项目:BFS-Prover

★BFS-Prover是一个基于大语言模型的自动定理证明系统,专注于在Lean4环境中生成策略。 该项目发布了其核心策略生成模型,能够在给定的证明状态下生成将当前证明状态转化为新状态的策略,逐步完成证明。 BFS-Prover通过集成多种组件实现可扩展的定理证明,并在MiniF2F测试基准上取得了最先进的性能。

☆一键收藏:

https://sota.jiqizhixin.com/project/bfs-prover


③项目:ACLaMP 3

★ACLaMP 3 是一个先进的音乐信息检索框架,支持多种模态(如文本、乐谱、音频、MIDI 和图像)和语言(训练支持 27 种语言,通用支持 100 种语言)。 该项目利用对比学习将多样的音乐模态对齐到一个共享的表示空间,实现无缝的跨模态检索。CLaMP 3 的性能显著优于之前的基线,支持所有主要的音乐模态和全球语言覆盖。

☆一键收藏:

https://sota.jiqizhixin.com/project/clamp3


④项目:MHA2MLA

★MHA2MLA项目旨在通过引入DeepSeek的多头潜在注意力机制,优化任何基于Transformer的LLM的推理效率。 该项目提供了相关代码和模型,支持Llama的微调和评估,并计划通过FlashMLA框架进一步减少GPU内存使用。

☆一键收藏:

https://sota.jiqizhixin.com/project/mha2mla


⑤项目:SurveyX

★SurveyX 是一个先进的学术综述自动化系统,利用大语言模型(LLMs)的强大功能生成高质量、领域特定的学术论文和综述。 用户只需提供论文标题和关键词,即可请求针对特定主题的综合学术论文或综述。该系统通过自动化论文创建简化了学术研究,节省了用户在编写研究内容上的时间和精力。

☆一键收藏:

https://sota.jiqizhixin.com/project/ surveyx




今日大模型在线列表 · API 免费调用

2025年2月25日更新

上新啦!DeepSeek R1系列

  • DeepSeek-R1-Distill-Qwen-1.5B

  • DeepSeek-R1-Distill-Qwen-7B

  • DeepSeek-R1-Distill-Llama-8B

  • DeepSeek-R1-Distill-Qwen-14B

  • DeepSeek-R1-Distill-Qwen-32B

  • Qwen2.5-14B-DeepSeek-R1-1M

① 其他

  • Skywork-o1-Open-Llama-3.1-8B

  • DeepSeek-VL2-tiny

  • Sky-T1-32B-Preview

------------- 详细内容 -------------

【上新啦!DeepSeek R1系列】

DeepSeek-R1-Distill-Qwen-1.5B

清湛/湖州 4090 公共线路;推理用时~5s

API调用地址:

https://sota.jiqizhixin.com/model-api/DeepSeek-R1-Distill-Qwen-1_5B_bff1b79d9b/chat/completions

获取秘钥:

https://sota.jiqizhixin.com/xt-terminal/4eca9f21-1686-46ad-b531-915e316f57c6


DeepSeek-R1-Distill-Qwen-7B

清湛/湖州 4090 公共线路;推理用时~8s

API调用地址:

https://sota.jiqizhixin.com/model-api/DeepSeek-R1-Distill-Qwen-7B_d35da06f87/chat/completions

获取秘钥:

https://sota.jiqizhixin.com/xt-terminal/ff02de2b-827f-4aae-96eb-0ec8b7cc12fa


DeepSeek-R1-Distill-Qwen-8B

清湛/湖州 4090 公共线路;推理用时~8s

API调用地址:

https://sota.jiqizhixin.com/model-api/DeepSeek-R1-Distill-Llama-8B_32c1ec967c/chat/completions

获取秘钥:

https://sota.jiqizhixin.com/xt-terminal/b69d4ea8-03c9-48bb-875f-01fdc458454a


DeepSeek-R1-Distill-Qwen-14B

清湛/湖州 4090 公共线路;推理用时~10s

API调用地址:

https://sota.jiqizhixin.com/model-api/DeepSeek-R1-Distill-Qwen-14B_4282130940/chat/completions

获取秘钥:

https://sota.jiqizhixin.com/xt-terminal/007daf69-9d8d-4805-a0cb-7f96a78c998d


DeepSeek-R1-Distill-Qwen-32B

清湛/湖州 4090 公共线路;推理用时~15s

API调用地址:

https://sota.jiqizhixin.com/model-api/DeepSeek-R1-Distill-Qwen-32B_4dda2127a7/chat/completions

获取秘钥:

https://sota.jiqizhixin.com/xt-terminal/bf9b6504-8270-44ee-830c-a4c690ef304b


Qwen2.5-14B-DeepSeek-R1-1M

清湛/湖州 4090 公共线路;推理用时~6s







请到「今天看啥」查看全文


推荐文章
海峡导报  ·  雷军升任中国新首富?最新回应
8 小时前
海峡导报  ·  雷军升任中国新首富?最新回应
8 小时前
大叔爱吐槽  ·  谁说老女人就美不起来了?
8 年前
亲仁书屋  ·  若无闲事挂心头,便是人间好时节
7 年前