直播 NO.5 | Facebook 田渊栋：用深度（强化）学习为组合优化寻找更好的启发式搜索策略

唧唧堂 · 公众号 · · 2020-02-22 19:10

正文

↑↑↑↑↑ 点击上方 蓝色字 关注我们！

『运筹OR帷幄』原创

对这次分享主题感兴趣的小伙伴，

欢迎在文末留言提问，

我们会收集有价值的问题，

请嘉宾在直播中亲自解答。

分享提纲

主题：《用深度（强化）学习为组合优化寻找更好的启发式搜索策略》

嘉宾：田渊栋博士

时间：北京时间 2020年 2月23号（周日）早 10：00

地点：『运筹OR帷幄』哔哩哔哩直播间

链接： live.bilibili.com/21459168

题目

Learning heuristic with Deep Learning and Reinforcement Learning for combinatorial optimization problems

简介

本次直播我们有幸请到 Facebook AI Lab 的田渊栋博士，为大家介绍他和团队近期在顶会 NeurIPS 和 ICLR 发表的三篇文章 [1] [2] [3]，内容涉及用（深度）强化学习和搜索方法搭配神经网络来寻找复杂优化问题的启发式算法的一些工作。

近年来，深度学习在处理自然数据输入(如计算机视觉、语音识别和自然语言处理)方面成绩斐然。然而，怎样用深度神经网络来处理结构化的数据，（如日志，优化问题的结构化描述，代码)，为一些离散优化问题找到一条替代人力启发式策略的神经网络方案，仍然是个未解决的问题。本次直播，我将简要介绍近期我们用强化学习和搜索方法搭配神经网络，来寻找复杂优化问题的启发式算法的一些工作。涉及到的应用领域包括：化简符号表达式、在线事务调度、车辆路径规化、神经网络架构搜索，以及从汇编代码中反编译出C代码。

嘉宾介绍

田渊栋博士，脸书（Facebook）人工智能研究院研究员及经理，研究方向为深度强化学习，多智能体学习，及其在游戏中的应用，和深度学习模型的理论分析。曾担任围棋开源项目 DarkForest 及 ELF OpenGo 项目中研究及工程负责人和第一作者。2013-2014年在Google无人驾驶团队任软件工程师。2005年及08年于上海交通大学获本硕学位，2013年于美国卡耐基梅隆大学机器人研究所获博士学位。曾获得2013年国际计算机视觉大会（ICCV）马尔奖提名（Marr Prize Honorable Mentions）。

扫描二维码直达『运筹OR帷幄』B 站直播间

对这次分享主题感兴趣的小伙伴，欢迎在文末留言提问，我们会收集有价值的问题，请嘉宾在直播中亲自解答

参考文献：

[1] Chen, X., & Tian, Y. (2019). Learning to perform local rewriting for combinatorial optimization. In Advances in Neural Information Processing Systems (pp. 6278-6289).

[2] Fu, C., Chen, H., Liu, H., Chen, X., Tian, Y., Koushanfar, F., & Zhao, J. (2019). Coda: An end-to-end neural program decompiler. In Advances in Neural Information Processing Systems (pp. 3703-3714).

[3] Wang, L., Xie, S., Li, T., Fonseca, R., & Tian, Y. (2019). Sample-efficient neural architecture search by learning action space. arXiv preprint arXiv:1906.06832 .

相关文章推荐

强化学习已经取得像AlphaGo这样举世瞩目的成绩，也成为最近的一个研究热点。组合优化是应用数学、计算机科学、运筹学等领域的重要问题，在调度、资源分配、物流、城市规划、电路设计、制药等领域应用广泛。强化学习与组合优化结合，能产生什么新机会？本次『运筹OR帷幄』社群线上直播，我们有幸邀请到了人工智能公司attain.ai.创始人，加拿大阿尔伯塔大学计算机系博士李玉喜先生，结合具体场景，为我们讲解强化学习在组合优化中的应用。

直播 NO.5 | Facebook 田渊栋：用深度（强化）学习为组合优化寻找更好的启发式搜索策略

正文

分享提纲

题目

Learning heuristic with Deep Learning and Reinforcement Learning for combinatorial optimization problems

简介

嘉宾介绍

点击蓝字标题，即可阅读《直播回顾 | Attain.ai 创始人李玉喜：强化学习遇见组合优化

请到「今天看啥」查看全文

直播 NO.5 | Facebook 田渊栋：用深度（强化）学习为组合优化寻找更好的启发式搜索策略

正文

分享提纲

题目 (adsbygoogle = window.adsbygoogle || []).push({}); Learning heuristic with Deep Learning and Reinforcement Learning for combinatorial optimization problems

简介

嘉宾介绍

点击 蓝字标题 ，即可阅读 《 直播回顾 | Attain.ai 创始人李玉喜： 强化学习遇见组合优化

请到「今天看啥」查看全文

题目

Learning heuristic with Deep Learning and Reinforcement Learning for combinatorial optimization problems

点击蓝字标题，即可阅读《直播回顾 | Attain.ai 创始人李玉喜：强化学习遇见组合优化