|
中科院化学所宋延林组火了 AINLP · 公众号 · · 3 周前 · |
|
|
【文档智能】轻量级级表格识别算法模型-SLANet AINLP · 公众号 · · 3 周前 · |
|
|
2024 年度总结 LLM System Research:过去半年的科研心路历程 AINLP · 公众号 · · 3 周前 · |
|
|
实测书生系列开源的最新模型-InternLM3-8B AINLP · 公众号 · · 3 周前 · |
|
|
DeepSeek-V3:开源模型的里程碑 - 从671B参数到全面领先的实力 AINLP · 公众号 · · 3 周前 · |
|
|
用LLM做文本分类,微调选base还是chat AINLP · 公众号 · · 3 周前 · |
|
|
千问又开源啦,开源过程奖励模型-Qwen2.5-Math-PRM AINLP · 公众号 · · 3 周前 · |
|
|
增强大模型的推理能力:从思维链到连续思维链(上) AINLP · 公众号 · · 3 周前 · |
|
|
Github揽获1.6K星!南大、腾讯发布VITA-1.5: 迈向GPT-4o级实时视频-语音交互 AINLP · 公众号 · · 3 周前 · |
|
|
阿里通义等提出Chronos:搜索智能体技术助力新闻时间线总结 AINLP · 公众号 · · 3 周前 · |
|
|
千问LLM:在家也能养“大脑”:本地运行大型语言模型的奇妙之旅 AINLP · 公众号 · · 3 周前 · |
|
|
从ROPE到Yarn, 一条通用公式速通长文本大模型中的位置编码 AINLP · 公众号 · · 3 周前 · |
|
|
计算DeepSeekV3训练的MFU AINLP · 公众号 · · 4 周前 · |
|
|
向量模型的词序感知缺陷与优化策略 AINLP · 公众号 · · 4 周前 · |
|
|
如何让 RLHF 训练更稳定? AINLP · 公众号 · · 4 周前 · |
|
|
deepseek v3训推优化的剖析 AINLP · 公众号 · · 4 周前 · |
|
|
1999美元!RTX5090发布 AINLP · 公众号 · · 4 周前 · |
|
|
[vLLM vs TensorRT-LLM] :系统调度schedule比较 AINLP · 公众号 · · 4 周前 · |
|
|
工作近五年,谈谈各类公司和部门的区别 AINLP · 公众号 · · 4 周前 · |
|
|
Baichuan Alignment Technical Report 论文精读 AINLP · 公众号 · · 4 周前 · |
|