专栏名称: 微软亚洲研究院

专注科研18年，盛产黑科技

明天直播 | ICLR 2024人气精选论文分享

微软亚洲研究院 · 公众号 · · 2024-05-29 17:00

正文

（本文阅读时间：4分钟）

人工智能国际顶级学术会议 ICLR 2024 刚刚落下帷幕，我们即刻为大家安排上微软亚洲研究院入选本届大会的人气精选论文直播！在此前的文章中，我们解读了涉及深度强化学习、多模态语言模型、时间序列扩散模型、无监督学习等多个领域的精选论文。根据大家的投票结果，我们特别邀请了两篇人气论文的作者就技术思路进行深度分享，快来看看你 pick 的论文吧！

两位论文作者将于5月30日（本周四）13:30在微信视频号“微软亚洲研究院”与“微软科技”的B站直播间，与大家共话人工智能和机器学习研究的最新趋势和未来发展！

在每篇论文的分享过程中，欢迎参与弹幕或评论区互动、提问，讲者将在分享结束后亲自为你答疑解惑！

直播信息

直播时间：

2024年5月30日13:30-14:30

直播地址：

B 站账号“微软科技”直播间

微信视频号“微软亚洲研究院 ”

论文及讲者介绍

汪炜

加拿大韦氏敦大学

博士

汪炜，本科毕业于天津大学，目前在加拿大韦氏敦大学计算机学院攻读博士四年级，研究兴趣主要集中在强化学习与模型泛化等领域。他对人工智能技术在生物学、机器人和游戏中的运用充满热情。此外，他曾在地平线机器人公司、字节跳动以及微软亚洲研究院实习。

论文题目：

应对深度强化学习中的信号延迟问题

Addressing Signal Delay in Deep Reinforcement Learning

论文摘要：

长期以来，深度强化学习（DRL）研究忽视了信号延迟的影响。本文通过扩展 MDP 形成延迟观测马尔可夫决策过程（DOMDP），分析信号延迟的挑战，并提出了有效策略，使得 DRL 算法能在具有较大延迟的控制任务中取得优异表现。

论文链接：

https://openreview.net/forum?id=Z8UfDs4J46

吴悦莹

北京大学

硕士

吴悦莹来自北京大学，目前在微软亚洲研究院实习，研究兴趣主要集中在时间序列预测领域。最近，她正在探索如何将生成模型（如扩散模型和大语言模型）与时间序列结合，以提高预测的准确性、稳定性和解释性。

论文题目：

MG-TSD：基于引导学习过程的多粒度时间序列扩散模型

MG-TSD: Multi-Granularity Time Series Diffusion Models with Guided Learning Process

论文摘要：

扩散概率模型在概率时间序列预测任务中的应用效果尚未得到充分验证。为此，本文提出了新颖的多粒度时间序列扩散（MG-TSD）模型，通过在扩散步骤中利用数据的内在粒度水平作为目标，引导扩散模型的学习过程，实现最先进的预测性能。

论文链接：

https://arxiv.org/abs/2403.05751

项目链接：

https://github.com/Hundredl/MG-TSD

日程安排

13:30-14:00

论文题目：

应对深度强化学习中的信号延迟问题

分享者：

汪炜

14:00-14:30

论文题目：

MG-TSD：基于引导学习过程的多粒度时间序列扩散模型

分享者：

吴悦莹

锁定微信视频号与 B 站直播间，明天与你不见不散！

明天直播 | ICLR 2024人气精选论文分享

正文

请到「今天看啥」查看全文