第一期:深度学习与文本分析(CIPS ATT5)
第二期:深度学习与NLP应用(CIPS ATT6)
时间:2017 年 8 月 17 日(周四)- 20 日(周日)
报到地点:北京语言大学
主办单位:中国中文信息学会, 中国中文信息学会学术工作委员会
承办单位:北京语言大学
主页:http://www.cipsc.org.cn/att2017/
在线注册现已开放:http://123.57.230.127/att/
注册费(含资料费和午餐费):
早注册费(7 月 25 日前):
中国中文信息学会会员:2 天 1500 元,4 天 2800 元
非会员:2 天 1800 元,4 天 3200 元
晚注册费(7 月 25 日后):
2 天 2000 元,4 天 3800 元
讲习班简介
深度学习研究如何通过监督学习、非监督学习、增强学习等手段,从大规模数据集中挖掘其内在结构,产生分布式表示,建立有效的多层神经网络。深度学习是人工智能领域的前沿热点,已在自然语言处理、计算机视觉、语音识别、计算机围棋等任务取得了令人瞩目的成绩,获得了学术界和工业界的广泛关注。
为进一步普及深度学习知识、促进自然语言处理技术发展、繁荣深度学习理论研究和工程开发,中国中文信息学会学术工作专委会定于 2017 年 8 月 17 日 - 20 日,在北京语言大学举办中国中文信息学会前沿技术讲习班(CIPS ATT),邀请来自研究第一线的知名青年专家学者系统讲述面向自然语言处理的深度学习基础知识、表示学习、网络模型和工具实战,为感兴趣的学者、学生和工程师提供一个四天的学习交流机会,快速了解有关的基本概念、研究内容、发展趋势、算法实现和开源工具。
本次讲习班包括两期共四天的学习内容。前两天介绍深度学习的基础理论知识和工具实战,以及深度学习在自然语言处理基础文本分析任务(包括词法、句法、语义分析和知识获取)上的前沿动态。后两天介绍深度学习在自然语言处理四个典型应用领域(如机器翻译、自动问答、社会计算与信息检索)上的前沿动态。
特邀讲者
本次讲习班邀请了在自然语言处理各领域开展深度学习研究、并取得有影响力成果的国内一线青年学者讲授深度学习理论知识,并邀请优秀博士生介绍深度学习工具实战,保证授课具有系统性和连贯性。按授课顺序,他们包括:
报告题目:深度学习基础知识与工具实战
报告人: 邱锡鹏、龚经经(复旦大学)
个人主页:http://nlp.fudan.edu.cn/xpqiu/
个人介绍
邱锡鹏,复旦大学计算机科学技术学院副教授,博士生导师。于复旦大学获得理学学士和博士学位。主要从事自然语言处理、深度学习等方向的研究,在 ACL、EMNLP、IJCAI 等计算机学会 A 类期刊、会议上发表 40 余篇学术论文,开源中文自然语言处理工具 FudanNLP 作者。2015 年入选首届中国科协人才托举工程,2017年ACL杰出论文奖。
龚经经,复旦大学博士生,主要研究领域为自然语言处理中的表示学习以及语句排序。TensorFlow 工程贡献者。
报告题目:深度学习与词法句法语义分析
报告人: 车万翔(哈尔滨工业大学)
个人主页:http://ir.hit.edu.cn/~car/
个人介绍:
车万翔博士,哈尔滨工业大学计算机学院副教授、博士生导师,斯坦福大学访问学者,合作导师 Christopher Manning 教授。现任中国中文信息学会计算语言学专业委员会委员、青年工作委员会副主任;中国计算机学会高级会员、YOCSEF 哈尔滨主席(2016-2017 年度)。主要研究领域为自然语言处理,在 ACL、EMNLP、AAAI、IJCAI 等国内外高水平期刊和会议上发表学术论文 40 余篇,其中 AAAI 2013 年的文章获得了最佳论文提名奖,出版教材 2 部,译著 2 部。目前承担国家自然科学基金、973 等多项科研项目。负责研发的语言技术平台(LTP)已被 600 余家单位共享,提供的在线“语言云”服务已有用户 1 万余人,并授权给百度、腾讯、华为等公司使用。2009 年,获 CoNLL 国际多语种句法和语义分析评测第 1 名。2016 年获黑龙江省科技进步一等奖;2015 和 2016 连续两年获得 Google Focused Research Award(谷歌专注研究奖);2012 年,获黑龙江省技术发明奖二等奖;2010 年获钱伟长中文信息处理科学技术奖一等奖、首届汉王青年创新奖等多项奖励。
报告题目:深度学习与知识获取
报告人: 刘康(中科院自动化所)
个人主页:http://www.nlpr.ia.ac.cn/cip/~liukang
个人介绍:
刘康,博士,现任中科院自动化所模式识别国家重点实验室副研究员。研究领域包括信息抽取、网络挖掘、问答系统等,同时也涉及模式识别与机器学习方面的基础研究。在自然语言处理、知识工程等领域国际重要会议和期刊发表论文四十余篇(如 TKDE、ACL、IJCAI、EMNLP、COLING、CIKM 等),获得 KDD CUP 2011 Track2 全球亚军,COLING 2014 最佳论文奖,首届“CCF-腾讯犀牛鸟基金卓越奖”、2014 年度中国中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新一等奖”、2015、2017 Google Focused Research Award 等。
报告题目:深度学习与机器翻译
报告人: 熊德意(苏州大学)
个人主页:http://hlt.suda.edu.cn/~dyxiong
个人介绍:
熊德意,博士,苏州大学计算机科学与技术学院教授、计算机系系主任。国家优秀青年科学基金(国家优青)获得者,江苏省“333 工程”和“六大人才高峰”培养对象,苏州市“高等院校、科研院所紧缺高层次人才”引进对象。2007 年至 2012 年在新加坡资讯通信研究院任研究科学家。主要研究方向为机器翻译、多语言信息获取、自然语言理解和深度学习等。在 Computational Linguistics、 IEEE TASLP、 AI、JAIR、 AAAI、 IJCAI、 ACL 等国际著名期刊和会议上发表论文 60 余篇,Springer 出版英文专著一部,编著会议论文集多部。2009 年获得北京市科学技术奖二等奖,2016 年获得中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新奖”一等奖。曾是亚洲自然语言处理联合会 AFNLP 干事、新加坡中文与东方语文信息处理学会理事会成员。目前是中文信息学会理事,江苏省人工智能学会智能系统及应用专委会副主任。担任 IALP 2012 程序委员会共同主席、CWMT 2017 程序委员会共同主席、欧盟多国联合项目 QTLeap 咨询专家等。
报告题目:深度学习与自动问答
报告人: 冯岩松(北京大学)
个人主页:
https://sites.google.com/site/ysfeng/home
个人介绍:
冯岩松,博士,北京大学计算机科学与技术研究所讲师。2011 年毕业于英国爱丁堡大学,获得信息科学博士学位。主要研究方向包括自然语言处理、信息抽取以及机器学习在自然语言处理中的应用;已连续三年在面向结构化知识库的知识问答评测 QALD-4, 5, 6 中获得第一名;相关工作已发表在 TPAMI、ACL、EMNLP 等主流期刊与会议上。同时,作为项目负责人或课题骨干已承担多项国家自然科学基金及科技部 863 计划项目。分别在 2014、2015 年获得 IBM Faculty Award,及 2016 年 IBM Shared University Research Award。
报告题目:深度学习与社会计算
报告人: 赵鑫(中国人民大学信息学院)
个人主页:http://playbigdata.com/batmanfly
个人介绍:
赵鑫,北京大学博士(导师李晓明),中国人民大学信息学院教师。研究领域为社交数据挖掘和自然语言处理领域,共发表 CCF A/B、SCI 论文 40 余篇, Google Scholar 引用 1400 余次。博士期间的研究工作主要集中在社交媒体用户话题兴趣建模研究,同时获得谷歌中国博士奖研金和微软亚洲学者称号。其中 ECIR’11 提出的 Twitter-LDA 成为短文本主题建模重要基准比较方法之一,单文引用次数超过 660 次。目前主要关注与社会经济紧密相关的商业大数据挖掘,研究用户意图检测、用户画像以及推荐系统,将理论技术运用到实践之中,承担国家自然科学青年基金、北京市自然科学青年基金,入选第二届 CCF“青年人才托举计划”。担任多个国际顶级期刊和学术会议评审、AIRS 2016 出版主席、SMP 2017 领域主席以及 NLPCC 2017 领域主席。
报告题目:深度学习与信息检索
报告人: 郭嘉丰(中科院计算所)
个人主页:http://www.bigdatalab.ac.cn/~gjf
个人介绍:
郭嘉丰,博士,现任中科院计算技术研究所研究员,中国科学院大学岗位教授,长期从事信息检索与数据挖掘方向的基础研究,研究方向包括用户查询理解、排序学习、文本建模、神经网络搜索等。在本领域国际重要学术会议与期刊上发表学术论文 80 余篇(如 TKDE、SIGIR、AAAI、CIKM 等),Google Scholar 累计引用 1800 余次,获得 ACM CIKM 2011 最佳论文奖,ACM SIGIR 2012 最佳学生论文奖,2012 年国家科技进步二等奖、2012 年中国中文信息学会 “钱伟长中文信息处理科学技术奖——汉王青年创新奖”一等奖,2016 年中科院青年促进会优秀会员等。
日程安排
第一期:深度学习与文本分析(CIPS ATT5)
8月17日(星期四) |
08:30-09:00 | 开幕式,合影 |
第一讲:深度学习基础知识 邱锡鹏,复旦大学 |
09:00-10:20 | 第一节 深度学习基础知识I | 基础知识、前馈神经网络、分布式表示 |
10:40-12:00 | 第二节 深度学习基础知识II | 卷积神经网络、循环神经网络、外部记忆与注意力模型 |
12:00-14:00 | 午餐,午间休息 |
14:00-15:20 | 第三节 深度学习基础知识III | 概率图模型、深度生成模型、深度强化学习 |
第二讲:深度学习工具实战 龚经经,复旦大学 |
15:40-17:00 | 第一节 深度学习工具实战 | TensorFlow介绍与深度学习模型实现 |
8月18日(星期五) |
第三讲:深度学习与词法句法语义分析 车万翔,哈尔滨工业大学 |
09:00-10:20 | 第一节 深度学习与词法句法语义分析I | 词法、句法与语义分析简介;结构化预测任务(序列分割、序列标注、句法分析);传统的结构化预测方法(基于图方法、基于转移的方法) |
10:40-12:00 | 第二节 深度学习与词法句法语义分析II | 基于神经网络的图方法;基于神经网络的转移方法 |
12:00-14:00 | 午餐,午间休息 |
第四讲:深度学习与知识获取 刘康,中科院自动化所 |
14:00-15:20 | 第一节 基于深度学习的知识表示 | 基于深度学习的词表示(NNLM、Word2Vector、Log-Bilinear等)、知识图谱表示学习(RESCAL、TransE、TransH、TransD、KG2E等)。 |
15:40-17:00 | 第二节 基于深度学习的知识获取 | 基于深度学习的知识抽取:实体关系抽取、开放域关系抽取、事件抽取。 |
第二期:面向自然语言处理的神经网络模型(CIPS ATT6)
8月19日(星期六) |
第一讲:深度学习与机器翻译 熊德意,苏州大学 |
09:00-10:20 | 第一节 神经机器翻译基础知识 | 神经机器翻译发展过程简介,串到串模型,基于注意力的神经机器翻译,注意力模型,集外词翻译,覆盖度模型,神经机器翻译与统计机器翻译比较与融合,神经机器翻译开源工具与平台 |
10:40-12:00 | 第二节 神经机器翻译进阶 | 字符与subword级神经机器翻译,基于句法的神经机器翻译与外部语言学知识融合,神经机器翻译新架构,多语与多模态神经机器翻译,神经机器翻译未来发展方向。 |
12:00-14:00 | 午餐,午间休息 |
第二讲:深度学习与自动问答 冯岩松,北京大学 |
14:00-15:20 | 第一节 深度学习与智能问答 I | 自动问答简介;传统知识库问答;基于深度学习的知识问答 I |
15:40-17:00 | 第二节 深度学习与智能问答 II | 基于深度学习的知识问答 II;基于深度学习的阅读理解;基于深度学习的对话系统 |
8月20日(星期日) |
第三讲:深度学习与社会计算 赵鑫,中国人民大学信息学院 |
09:00-10:20 | 第一节 网络表示 | 主要以network embedding作为主要技术点,包括一些基本的network embedding模型(包括DeepWalk、LINE、Node2vec等),同时也包括一些拓展工作(包括异质关系网络融合表示) |
10:40-12:00 | 第二节 推荐系统 | 主要介绍最近几年深度学习在推荐系统中的应用,将分为两大块,刻画用户与物品交互以及刻画附加内容信息。将会涵盖大部分最新的深度学习推荐模型。 |
12:00-14:00 | 午餐,午间休息 |
第四讲:深度学习与信息检索 郭嘉丰,中科院计算所 |
14:00-15:20 | 第一节 基于分布式表示的信息检索 | 深度学习搜索发展历史简介、分布式表达、基于分布式表达的信息检索模型及其在检索问题上的应用 |
15:40-17:00 | 第二节 基于深层匹配的信息检索 | 信息检索的深层匹配建模、深层匹配模型及其在不同检索问题上的应用,相关的Toolkit介绍 |
17:00-17:30 | 结业仪式 |
组织信息
大会主席:
学术主席:
刘洋,清华大学计算机科学与技术系副教授,博士生导师,国家优秀青年基金获得者。研究方向是自然语言处理,在自然语言处理和人工智能领域重要国际刊物 Computational Linguistics 和国际会议 ACL、EMNLP、IJCAI 和 AAAI 上发表 40 余篇论文,获 ACL 2017 杰出论文奖和 ACL 2006 优秀亚洲自然语言处理论文奖。承担 10 余项国家自然科学基金、国家重点研发计划、国家 863 计划、国家科技支撑计划和国际合作项目,2015 年获国家自然科学基金优秀青年项目资助。获得 2015 年国家科技进步二等奖、2014 年中国电子学会科学技术奖科技进步类一等奖、2009 年北京市科学技术奖二等奖和 2014 年中国中文信息学会钱伟长中文信息处理科学技术奖汉王青年创新奖一等奖等多项科技奖励。担任中国中文信息学会青年工作委员会主任兼计算语言学专业委员会秘书长、国际计算语言学学会 SIGHAN Information Officer、ACM TALLIP Associate Editor、ACL 2015 组织委员会共同主席、ACL 2014 讲习班共同主席、ACL 2017 与 EMNLP 2016 程序委员会机器翻译领域共同主席。
个人主页: http://nlp.csai.tsinghua.edu.cn/~ly/
刘知远,清华大学计算机系助理教授,博士生导师。主要研究方向为表示学习、知识图谱和社会计算。2011 年获得清华大学博士学位,已在 AAAI、IJCAI、ACL 等人工智能领域的著名国际期刊和会议发表相关论文 30 余篇,Google Scholar 统计引用超过 1200 次。承担多项国家自然科学基金。曾获清华大学优秀博士学位论文、中国人工智能学会优秀博士学位论文、清华大学优秀博士后、中文信息学会青年创新奖,入选中国科学青年人才托举工程、CCF-Intel 青年学者提升计划。担任中文信息学会青年工作委员会执委、副主任,中文信息学会社会媒体处理专委会委员、秘书,SCI 期刊 Frontiers of Computer Science 青年编委。担任 ACL、IJCAI、AAAI、NAACL、EMNLP、WWW、WSDM 等著名学术会议的程序委员会委员以及 TKDE、TOIS、JCST 等著名学术期刊审稿人。
个人主页:http://nlp.csai.tsinghua.edu.cn/~lzy/
组织委员会主席: