|
大语言模型的解码策略与关键优化总结 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
基于结构化状态空间对偶性的贝叶斯注意力机制设计与实现 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
Hinton怒斥马斯克「电锯」屠遍美国科学界!3410位大佬联名将其从英国皇家学会除名 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
「债台高筑」孙正义,狂借500亿美元砸向OpenAI!马斯克:杠杆率太高了 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
马斯克暴论:5年内AI超越人类总智能,2029年文明终结概率20%!谷歌却在疯狂「玩火」 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
4499元16G显存,AMD端掉英伟达?RX 9070系显卡出世,4K狂飙直追旗舰 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
知识蒸馏技术原理详解:从软标签到模型压缩的实现机制 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
多模态基础模型的机制可解释性综述 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
刚刚,DeepSeek全面开源V3/R1推理系统!成本利润率高达545% 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
DeepSeek第五天开源猛料,3FS并行文件系统榨干SSD!6.6 TiB/s吞吐量堪比光速 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
构建可靠的时间序列预测模型:数据泄露检测、前瞻性偏差消除与因果关系验证 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
从系统1到系统2:推理大语言模型综述 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
黄仁勋:感谢DeepSeek!英伟达财报破纪录,Blackwell开卖血赚800亿老黄笑疯 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
ICLR 2025 | CATCH:基于频段通道感知的多变量时间序列异常检测框架 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
英伟达下场,首次优化DeepSeek-R1!B200性能狂飙25倍,碾压H100 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
Claude 3.7 Sonnet游戏里贪吃蛇惊现自我意识?发现自己是代码绝望崩溃 机器学习研究组订阅 · 公众号 · AI · 1 周前 · |
|
|
刚刚,DeepSeek开源DeepEP通信库,千亿MoE训推颠覆级创新!FP8狂飙,带飞GPU 机器学习研究组订阅 · 公众号 · AI · 2 周前 · |
|