专栏名称: 黄建同学

数码博主超话主持人（ChatGPT超话）头条文章作者我的学习笔记，关注AI+新能源

目录

相关文章推荐

量子位 · 奥特曼再谈DeepSeek：肯定开源模型巨大 ... · 2 天前

爱可可-爱生活 · 【[23星]iFormer：为移动应用打造的 ... · 2 天前

宝玉xp · 哈哈，自从 DeepSeek ... · 3 天前

黄建同学 · 这个项目的codebase是基于Open-R ... · 4 天前

黄建同学 · 话说，AI ... · 4 天前

51好读 › 专栏 › 黄建同学

Tom Yeh教授的DeepSeek专门讲座视频↓（就是那个用e-20250210182243

黄建同学 · 微博 · AI · 2025-02-10 18:22

正文

2025-02-10 18:22
本条微博链接

Tom Yeh教授的DeepSeek专门讲座视频↓（就是那个用excel实现Transformer的厉害教授

网页链接）

讲座大纲：
1. Transformer

2. 注意力机制（Attention）
- 自注意力机制（Self-Attention）
- 多头注意力机制（Multi-Head Attention）
- 多头潜在注意力机制（Multi-Head Latent Attention，DeepSeek）

3. 前馈网络（Feed-Forward）
- 单专家（Single Expert）
- 专家混合（Mixture of Experts, MoE）
- 稀疏专家混合（Sparse Mixture of Experts）
- 共享+路由专家混合（Shared+Routed Mixture of Experts，DeepSeek）

4. 旋转位置编码（RoPE, Rotary Position Embedding）

访问：www.byhand.ai/p/deepseek-lecture-128

#deepseek# #AI.com直达DeepSeek# #ai创造营#

请到「今天看啥」查看全文

推荐文章

量子位 · 奥特曼再谈DeepSeek：肯定开源模型巨大贡献，坚信人类终将实现AGI

2 天前

爱可可-爱生活 · 【[23星]iFormer：为移动应用打造的高效视觉模型，将卷积-20250208142551

2 天前

宝玉xp · 哈哈，自从 DeepSeek 不隐藏思维链，现在都不隐藏了！v0-20250207142805

3 天前

黄建同学 · 这个项目的codebase是基于Open-R1-Multimod-20250207092206

4 天前

黄建同学 · 话说，AI 眼镜的一个非常有用的用途就是跨语言交流，包括实时图像-20250207094559

4 天前

微设计 · 夏克梁的手绘艺术精粹合集《画说20年》

8 年前

英国那些事儿 · 跟父母一起看电视看到激情床戏肿么办。各路网友这一波，也是尴尬我一脸

7 年前

生态梦网 · 生态城中津大道将启动全线贯通施工，有望缓解进出城交通压力

7 年前

24小时全球守望祷告中心 · 嫉妒像一把刀，刺在了别人身上，插进了自己心里！

7 年前

健康界 · 语音助手兴起电子病历的硬伤终于有了解决方案

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!