专栏名称: SDNLAB
SDNLAB是专注网络创新技术的先锋媒体社区和实践应用平台,涵盖AI 网络、DPU/智能网卡、SD-WAN/SASE、Web3.0、零信任、云网融合等相关领域,提供新闻资讯、技术交流、在线实验、行业分析、求职招聘、教育培训等多元服务。
目录
相关文章推荐
51好读  ›  专栏  ›  SDNLAB

【技术人必看】大模型时代,我们为你准备了这份深度指南

SDNLAB  · 公众号  ·  · 2025-03-21 15:25

正文

请到「今天看啥」查看全文


各位深耕 AI 领域的伙伴们,在见证大模型技术以指数级速度迭代的今天,我们特别为您打造了一个全新的技术探索平台 ——「究模智」。


究模智—— 诞生于大模型狂飙时代的冷静思考



  • 显微镜观察:

    穿透技术喧嚣,解构大模型底层逻辑与演进脉络。

  • 工程师思维:

    从科研探索到产业落地,做开发者案头可信的「问题终结者」。

  • 长效知识库:

    在碎片化信息洪流中,搭建可沉淀、可复用的认知坐标系。



使命宣言



究本质,智未来。 让每一次点击都成为技术认知的「复利投资」


四大核心栏目剧透



  • 智讯 | 穿透噪声的信息雷达

    每周精选高信噪比快讯:政策解读、巨头动向、行业进展。


  • 智解 | 破解壁垒的技术战斧

    每周分享大模型技术精华:基础概念、关键技术、未来趋势。


  • 智研 | 贯通产研的创新实验室

    每月发布科研圈干货:Paper精读、顶会跟踪、科研突破。


  • 智库 | 汇聚智慧的AI仓库

    每月上新AI技术干货:技术文档、案例分享、行业报告。


此刻,邀请你成为「究镜派」!


现在关注 【究模智】 公众号,即可获得:


✅ 首期福利“ 100+份精选大模型领域权威资料(PDF)

✅ 加入「 硬核讨论群 」与一线从业者直接对话。


图片


附:100+份精选大模型领域权威资料(PDF)清单

DeepSeek*50份

推荐理由:集成DeepSeek官方技术白皮书、知名高校前沿研究、行业领袖实战指南及三方机构多维分析,构建「技术原理-开发实践-产业应用」三位一体知识体系,提供从认知构建到商业落地的全栈式学习范式。

【清单】

1-DeepSeekR1技术报告_22页

2-DeepSeekV3技术报告_53页

3-DeepSeek与AIGC应用_北京大学_99页

4-DeepSeek-R1及类强推理模型开发解读报告_北京大学_76页

5-大模型概念、技术与应用实践_厦大团队_140页

6-Deepseek模型优势算力成本角度解读报告_浙江大学_24页

7-DeepSeek与DeepSeek-R1专业研究报告_38页

8-提示词工程和落地场景_北京大学_86页

9-DeepSeek-回望AI三大主义与加强通识教育_浙江大学_ 52页

10-DeepSeek大模型赋能高校教学和科研报告_厦大团队_124页

11-DeepSeek使用教程蓝皮书_全球数据资产理事会_35页

12-深度解读DeepSeek原理与效应_天津大学_44页

13-DeepSeek从入门到精通_ 清华_104页

14-我们该如何看待DeepSeek_湖南大学_ 82页

15-DeepSeek入门宝典-个人使用篇_51CTO_ 19页

16-DeepSeek入门宝典-技术解析篇_ 51CTO_ 22页

17-DeepSeek入门宝典-开发实战篇_ 51CTO_ 25页

18-DeepSeek入门宝典-行业应用篇_ 51CTO_ 18页

19-DeepSeek模型本地部署介_智灵动力_55页

20-DeepSeek完全实用手册V1.0-从技术原理到使用技巧_至顶AI实验室_ 117页

21-深入浅出讲解Deepseek(含部署)_47页

22-详解DeepSeek模型训练优化及数据处理的技术精髓_腾讯云--23页

23-2025年DeepSeek自学手册-从理论模型训练到实践模型应用_ @ai呀蔡蔡_ 73页

24-DeepSeek15天指导手册从入门到精通_24页

25-Deepseek V3 搭建个人知识库教程2025_ 6页

26-ChattingorActing-DeepSeek的突破边界与浙大先生的未来图景_浙江大学_86页

27-从DeepSeek探讨大语言模型在建筑及能源行业的应用趋势和技术方法报告_浙江大学_ 81页

28-2025年DeepSeekDeepResearch让科研像聊天一样单_清华大学北航_86页

29-2025年DeepSeek行业应用实践报告_智灵动力_112页

30-DeepSeek与AIGC应用_北京大学_99页

31-DeepSeek给我们带来的创业机会_清华大学_ 76页

32-DeepSeek如何赋能职场应用_清华大学_75页

33-DeepSeek与AI幻觉报告_清华大学_38页

34-普通人如何抓住DeepSeek红利_清华大学_64页

35-DeepSeek DeepResearch应用报告_清华大学_59页

36-2025数据资产全过程管理解锁DeepSeek智能引警报告_全球数据资产理事会_63页

37-围绕Deepseek尖刀点加速打造AI产业刀锋_39页

38-DeepSeek 7大场景+50大案例+全套提示词_从入门到精通_觉醒学院xAI流量坊_112页

39-DeepSeek对于科技和更广义经济的含义是什么?_摩根斯坦利_ 70页

40-2025年DeepSeeK开启AI算法变革元年_甲子光年_17页

41-2025年DeepSeek开启AI算法变革元年报告_甲子光年_16页

42-2025年DeepSeek行业应用案例集解锁智能变革密码_浙江大学_153页

43-DeepSeek带动国产专用芯片、AIDC、物联网等板块景气度攀升_国金证券_ 11页

44-Deepseek国产AI应用的诺曼底时刻_华西证券_33页

45-DeepSeek惊艳世界,算力与应用将迎来结构性变化_东方证券_18页

46-DeenSeek题材持续发酵,模型迭代加速推进_10页

47-DeepSeek重塑开源大模型生态AI应用爆发持续推升算力需求_国信证券_42页

48-大模型步入开源免费时代,运营商接入DeepSeek拓展新业务_ 国信证券_17页

49-为什么DeepSeek最受益方向是云产业链_民生证券_28页

50-A工智能基地2025DeepSeek爆火详细报告_71页


大模型*25份

推荐理由:集成清华、信通院、阿里、腾讯等机构和单位大模型精品材料,提供技术/应用/市场类白皮书、和电子书籍等丰富材料,构建「技术演进-开发范式-产业融合-市场评估」四维认知体系,粉丝可储备大模型方向从技术基础到投资风控的完整知识链。

【清单】

1-【技术】0-AIGC发展研究3.0版 清华186页

2-【技术】人工智能发展报告(2024年)中国信通院 64页

3-【技术】2024大模型训练数据白皮书-阿里研究院-32页

4-【书籍】基于GPT-3、ChatGPT、GPT-4等Transformer 架构的自然语言处理(OCR)-书籍-379页田】5-【书籍】从零开始大模型开发与微调基于PyTorch与ChatGLM-书籍-376页

6-【书籍】大规模语言模型:从理论到实践-书籍-297页

7-【书籍】大模型应用开发极简入门:基于GPT-4和ChatGPT 2024 177页

8-【书籍】一本书读懂AIGC:ChatGPT、AI绘画、智能文明与生产力变革 256页

9-【书籍】大模型基础 完整版-290页

10-【应用】大模型金融应用实践及发展建议69页

11-【应用】2024大模型典型示范应用案例集 219页

12-【应用】2024年中国A大模型场景探索及产业应用调研报告 6页

13-【应用】大模型在金融行业的落地探索 36页

14-【应用】2024中国大模型先锋案例TOP30

15-【应用】2024年中国A|大模型场景探索及产业应用调研报告-大模型”引爆”行业新一轮变革

16-【应用】2024中国”大模型+智能客服”最佳实践案例TOP10

17-【应用】2024年中国大模型行业应用优秀案例白皮书6页

18-【应用】2024中国“大模型+数据分析”最佳实践案例TOP10

19-【应用】北京市人工智能行业大模型创新应用白皮书-72页

20-【应用】大模型在日志运维场景的应用实践24页

21-【市场】2024行业大模型调研报告-腾讯研究院-86页

22-【市场】2024大语言模型能力测评报告-极客公园-43页

23-【市场】2024年中国A大模型产业发展报告至顶科技41页

24-【市场】AlAgent行业研究报告 甲子光年 60页

25-【市场】《知识图谱与大模型融合实践研究报告》72页


大模型面试题*52份

推荐理由:集成大厂算法面经、学界前沿命题集及行业级场景解题框架,构建「基础架构-核心算法-工程优化-应用范式」四维技术评估体系,形成从模型预训练(增量学习策略)到工业级部署(显存优化方案)的完整能力图谱。

【清单】

1-大模型(LLMs)基础面

2-Layer normalization篇

3-LLMs 激活函数篇

4-Attention 升级面

5-transformers 操作篇

6-LLMs 损失函数篇

7-相似度函数篇

8-大模型(LLMs)进阶面

9-大模型(LLMs)微调面

10-LLMS训练经验帖

11-大模型(LLMs)langchain 面

12-多轮对话中让AI保持长期记忆的8种优化方式篇

13-基于langchain RAG问答应用实战

14-基于LLM+向量库的文档对话 经验面

15-大模型 RAG 经验面

16-LLM文档对话 -- pdf解析关键问题

17-大模型(LLMS)RAG 版面分析--表格识别方法篇

18-大模型(LLMS)RAG 版面分析--文本分块面

19-大模型外挂知识库优化--如何利用大模型辅助召回?

20-大模型外挂知识库优化--负样本样本挖掘篇

21-RAG(Retrieval-Augmented Generation)评测面

22-检索增强生成(RAG) 优化策略篇

23-大模型(LLMS)RAG --关键痛点及对应解决方案

24-大模型(LLMS)RAG 优化策略-- RAG-Fusion篇

25-Graph RAG 面 一种 基于知识图谱的大模型检索增强实现策略

26-大模型(LLMs)参数高效微调(PEFT)面

27-适配器微调(Adapter-tuning)篇

28-提示学习(Prompting)篇

29-LoRA 系列篇

30-如何使用 PEFT库 中 LORA?

31-大模型(LLMs)推理面

32-大模型(LLMs)增量预训练篇

33-增量预训练(Pretrain)样本拼接篇

34-基于lora的llama2二次预训练

35-大模型(LLMs)评测面

36-大模型(LLMs)强化学习面

37-大模型(LLMS)强化学习--RLHF及其变种面

38-大模型(LLMs)强化学习-- PPO 面

39-强化学习在自然语言处理下的应用篇

40-大模型(LLMs)训练集面

41-大模型(LLMS)LLM生成SFT数据方法面

42-大模型(LLMS)显存问题面

43-显存优化策略篇

44-大模型(LLMS)!分布式训练面

45-图解分布式训练(一)--流水线并行(Pipeline Parallelism)

46-图解分布式训练-nn.DataParallel篇

47-图解分布式训练nn.parallel.DistributedDataParallel

48-图解分布式训练(四)--torch.multiprocessing 详细解析

49-图解分布式训练AMP混合精度训练 详细解析5

50-图解分布式训练(六)--Pytorch的 Deepspeed 详细解析

51-图解分布式训练(七)-- accelerate 分布式训练 详细解析

52-图解分布式训练(八)--ZeRO 学习


精选视频*6份

【清单】

1、【DeepSeek从入门到精通-清华大学】

推荐理由:清华大学出品,以专业视角深探 DeepSeek,从基础概念到实操技巧,带你稳步迈向精通殿堂。

观看地址:https://c.m.163.com/news/v/VLMRO60JL.html


2、【大模型交叉研讨课-清华大学】

推荐理由:清华刘知远团队倾心讲授大模型交叉研讨课,从系统设计出发,多维度解锁大模型多样应用场景。

观看地址:https://www.bilibili.com/video/BV1UG411p7zv/


3、【大模型技术与交叉应用第二季-清华大学】

推荐理由:清华大模型公开课第二季,汇聚前沿知识,全方位解读大模型的相关理论与实践。

观看地址:https://www.bilibili.com/video/BV1pf421z757/


4、【DeepSeek原理与落地应用-北京大学】

推荐理由:北大数智教育沙龙内部研讨,深度揭秘 DeepSeek 原理,手把手教你将其巧妙落地应用的实用方法。

观看地址:https://www.bilibili.com/video/BV1rcQwYrEH4/


5、【大模型概念、技术与应用实践-厦门大学】

推荐理由:厦大林子雨副教授系统梳理大模型知识体系,结合 DeepSeek 案例,清晰讲解大模型实操用法。

观看地址:https://www.bilibili.com/video/BV1CLRYYVEkC/


6、【大模型原理与技术-浙江大学】

推荐理由:浙江大学软件学院大模型原理与技术课程拆解多模块知识,深入剖析大模型底层逻辑与核心技术。

观看地址:https://www.bilibili.com/video/BV1PB6XYFET2/

点击公众号名片,赶快关注领取免费资料吧!







请到「今天看啥」查看全文