导师一上来就布置任务让复现顶会论文?是否把作者的官方代码跑通就算复现成功?怎么根据实际的场景灵活提出新的模型,或者提出对现有模型的改造发论文?
实际上搞清这些才是
读研/转行
的
核心竞争力
,同时是
发高区/顶会
必须要具备的能力。
顶会论文中的90%可能都是灌水的,高区没有大家想象中那么难发。
李沐大神
早就发表过相关观点,对于研究者来,基于前人工作,做出细微的改动,然后有理有据的把结果写下来就已经能发论文了。
那么到底如何真正提升自己的核心竞争力?
本次研梦非凡邀请了
手握多篇顶会的杨导师
正式上线
《2025新拐点!多模态大模型训练营》
带你「
深入理解并复现3篇最前沿多模态大模型顶会论文」,逐一击破复现难点
。
9节课
「通过论文解析+代码复现,掌握项目实战经验」
。以讲解论文为示例,教会大家复现大部分顶会论文的方法,
从大佬的代码中发掘创新点,解决实际科研问题,让涨点不再困难!
(下滑查看课程详情)
AAAI2024共111篇+CVPR 2024
共
88篇+ICML 2024
共
67
篇+NeurIPS 2024共106篇+ICLR2024共106篇+多模态大模型必读论文170篇
适合哪些人群?
适合的群体:
-
在校生:计算机萌新,感到迷茫,不知道怎么复现论文的;想好好规划四年又无从下手的;想拼搏几年,找个好出路的;非科班专业想转行做AI的;
-
毕业冲刺:玩了几年,时间紧迫,想在短时间内发论文毕业的;基础还可以,想冲顶会提升背景进大厂的:
-
社招:工作 1-5 年需要顶会高区论文背书跳槽涨薪的
不适合群体:
-
不适合已经有扎实基础且有自主创新科研能力的,如已经发过高区、顶会的:
-
新春活动现仅需
99元
(原价299元)
凡添加即可免费试看2节课!
还可领取600+顶会论文
二、能收获什么?
-
掌握多模态学习的基础知识,了解多模态深度学习的核心原理和架构,学习融合不同模态数据的挑战和最佳实践。
-
熟悉先进的多模态模型架构,探索基于transformer的多模态模型,深入了解视觉-语言模型及其应用
-
掌握多模态数据处理和特征工程,学会有效预处理和对齐多模态数据,掌握从不同数据源提取有意义特征的技巧
-
学会多模态模型的训练和优化,了解最新的多模态模型训练技术,学会微调和适配预训练模型到特定任务
-
部署和应用多模态AI系统,探讨部署多模态AI系统的注意事项,学习成功案例并讨论实际应用
三、能帮助到你什么?
9节课深入解读业界最新论文,包括Visual Instruction Tuning、MobileVLM和LLaVA-NeXT
-
-
紧跟行业前沿,实战驱动,培养大家运用所学解决实际问题的能力
-
还可领取600+顶会论文
四、实战训练营大纲(9节课)
-
第一节课: Visual Instruction Tuning 介绍(1月14号)
免费试看!!!
亮点:
教你如何有效阅读论文,大致梳理文章结构,解构文章,梳理重点章节。
-
第二节课:Visual Instruction Tuning 精读(1月15号)
免费试看!!!
亮点:
根据文章梳理对应公式,理清重点段落流程,细化结构。
-
第三节课:Visual Instruction Tuning 复现
亮点:
分析及推导公式,根据公式手把手教写相应代码,重构论文,在复现的基础上做创新,提升自己的工程能力。
-
第四节课: MobileVLM: Vision Language Models for Mobile Devices 介绍
-
第五节课: MobileVLM: Vision Language Models for Mobile Devices 精读
-
第六节课: MobileVLM: Vision Language Models for Mobile Devices 复现
-
第七节课: LLaVA-NeXT: Improved reasoning, OCR, and world knowledge 介绍
-
第八节课: LLaVA-NeXT: Improved reasoning, OCR, and world knowledge 精读
-
第九节课: LLaVA-NeXT: Improved reasoning, OCR, and world knowledge 复现
还可领取600+顶会论文
五、讲师介绍
杨
导
师
世界top10大学计算机科学毕业博士
博士研究方向为计算机视觉,自然语言处理,高效的深度学习训练和推理方法,大语言模型轻量化与高效微调技术。
多家公司担任算法研究员,并进行计算机视觉,高效模型压缩算法,多模态大语言模型的研究,包括模型量化,剪枝,蒸馏,编译以及高效稀疏化训练与推理。
【科研成果】
在国际顶级会议CVPR,ICCV, EMNLP等发表13篇论文,并担任CVPR,ICCV,ECCV,ICML,ICLR, NeurIPS等重要会议和期刊的审稿人。
多项发明专利,指导学生有耐心,教学严谨,思维逻辑缜密,已经指导数十篇论文。
对于成果好的学生,帮助学生写推荐信和指导申请硕/博申请。
【招收学生方向】
计算机视觉,自然语言处理,高效模型压缩算法,多模态大语言模型,包括模型量化,剪枝,蒸馏,编译以及高效稀疏化训练与推理,深度学习全栈研究。
六、课程服务
课程形式及时长
9节直播课,每节1小时左右
课程价格
原价:
299元
新春优惠价:99元!
本号粉丝免费试看两节直播课!!!
(金杯银杯不如同学们的口碑,最终购买权在同学们手上!
)
还可领取600+顶会论文
课程服务
-
-
-
可能有的Q&A
Q1:有问题如何询问老师?
-
本系列课程为直播课,可以在直播间弹幕发送提问,老师看见会一一解答。
并且我们还配有答疑群,老师会在群内不定时文字答疑。
Q2:课程有效期及服务有效期是多久?