AINLP - 公众号 - 文章列表

文章总数 7838

51好读 › 专栏 › AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

最新

2024年RAG：回顾与展望

AINLP · 公众号 · · 4 周前 ·

千问LLM之LLM的特工行动：工具召唤功能实战案例？Agent 到底是什么？

AINLP · 公众号 · · 4 周前 ·

文末赠书 | 技术人的年末书单，这10本最受欢迎！

AINLP · 公众号 · · 1 月前 ·

从infra的视角聊聊DeepSeek-V3

AINLP · 公众号 · · 1 月前 ·

千问LLM：什么是 Sharding? 之ZeRO 优化（Zero Redundancy Optimizer）

AINLP · 公众号 · · 1 月前 ·

曾经火热的Graph Embedding和GNN在推荐系统上还有前途吗？

AINLP · 公众号 · · 1 月前 ·

图解Megatron TP中的计算通信overlap

AINLP · 公众号 · · 1 月前 ·

评价deepseek v3：又一个相信自己比英伟达懂GPU计算并做到了的团队

AINLP · 公众号 · · 1 月前 ·

手写self-attention的四重境界 self-attention

AINLP · 公众号 · · 1 月前 ·

谷歌41岁天才科学家SuperGLUE之父英年早逝！两月前留下绝笔：从事大模型研究让我深陷抑郁！

AINLP · 公众号 · · 1 月前 ·

LLM 预训练到头了吗？

AINLP · 公众号 · · 1 月前 ·

微软公布OpenAI闭源模型参数！4o-mini 8B！

AINLP · 公众号 · · 1 月前 ·

DeepSeek-V3技术报告解读

AINLP · 公众号 · · 1 月前 ·

Deepseek V3 预训练策略解读

AINLP · 公众号 · · 1 月前 ·

2024年大模型总结与展望（技术下篇）

AINLP · 公众号 · · 1 月前 ·

长文 | 大模型Post-Training总结

AINLP · 公众号 · · 1 月前 ·

OpenAI-o3 与 Monte-Carlo 思想

AINLP · 公众号 · · 1 月前 ·

o1-Coder：代码领域的OpenAI o1模型复现

AINLP · 公众号 · · 1 月前 ·

一本醍醐灌顶的「大语言模型提示工程」教科书，熬夜读完

AINLP · 公众号 · · 1 月前 ·

5个开源RAG框架对比

AINLP · 公众号 · · 1 月前 ·