|
2024年RAG:回顾与展望 AINLP · 公众号 · · 4 周前 · |
|
|
千问LLM之LLM的特工行动:工具召唤功能实战案例?Agent 到底是什么? AINLP · 公众号 · · 4 周前 · |
|
|
文末赠书 | 技术人的年末书单,这10本最受欢迎! AINLP · 公众号 · · 1 月前 · |
|
|
从infra的视角聊聊DeepSeek-V3 AINLP · 公众号 · · 1 月前 · |
|
|
千问LLM:什么是 Sharding? 之ZeRO 优化(Zero Redundancy Optimizer) AINLP · 公众号 · · 1 月前 · |
|
|
曾经火热的Graph Embedding和GNN在推荐系统上还有前途吗? AINLP · 公众号 · · 1 月前 · |
|
|
图解Megatron TP中的计算通信overlap AINLP · 公众号 · · 1 月前 · |
|
|
评价deepseek v3:又一个相信自己比英伟达懂GPU计算并做到了的团队 AINLP · 公众号 · · 1 月前 · |
|
|
手写self-attention的四重境界 self-attention AINLP · 公众号 · · 1 月前 · |
|
|
谷歌41岁天才科学家SuperGLUE之父英年早逝!两月前留下绝笔:从事大模型研究让我深陷抑郁! AINLP · 公众号 · · 1 月前 · |
|
|
LLM 预训练到头了吗? AINLP · 公众号 · · 1 月前 · |
|
|
微软公布OpenAI闭源模型参数!4o-mini 8B! AINLP · 公众号 · · 1 月前 · |
|
|
DeepSeek-V3技术报告解读 AINLP · 公众号 · · 1 月前 · |
|
|
Deepseek V3 预训练策略解读 AINLP · 公众号 · · 1 月前 · |
|
|
2024年大模型总结与展望(技术下篇) AINLP · 公众号 · · 1 月前 · |
|
|
长文 | 大模型Post-Training总结 AINLP · 公众号 · · 1 月前 · |
|
|
OpenAI-o3 与 Monte-Carlo 思想 AINLP · 公众号 · · 1 月前 · |
|
|
o1-Coder:代码领域的OpenAI o1模型复现 AINLP · 公众号 · · 1 月前 · |
|
|
一本醍醐灌顶的「大语言模型提示工程」教科书,熬夜读完 AINLP · 公众号 · · 1 月前 · |
|
|
5个开源RAG框架对比 AINLP · 公众号 · · 1 月前 · |
|