专栏名称: 大数据文摘

普及数据思维，传播数据文化

Podcast脱口秀重磅上线 | 听数据大咖们把枯燥的人工智能Paper花式聊出来

大数据文摘 · 公众号 · 大数据 · 2017-02-17 07:26

正文

大数据文摘作品，转载要求见文末

读paper读不下去？又想了解最in的人工智能和大数据前沿干货？大数据文摘这款Podcast脱口秀【5263FM】绝对适合你。在码代码、开车、等地铁的无聊间隙，来听听数据大咖们把人工智能paper花式聊出来。

AAAI大会的国内大公司都发了哪些paper？

大会的最佳paper在探讨什么话题？

这些paper背后又涉及到怎样的商业布局？

在CMU战胜了德州扑克职业玩家的AI到底意义何在？

吴恩达为什么称其意义堪比深蓝和阿尔法狗？

深度学习框架有哪些？

如何横向对比它们？

在夜黑风高的元宵节深夜，

来自英国伦敦、

美国路易斯安那

和北京的三位数据咖在线上相聚，

就这些话题深入聊了

4个小时仍意犹未尽。

3位大咖

主编：加号

本期嘉宾：寒小阳、Aileen

鉴于微信对音频内容的长度限制，大数据文摘截取了其中的精华部分，在微信上分期剪辑放出，不过瘾的同学请点击文末阅读原文跳转至Podcast的【5263FM】栏目主页，获取完整聊天干货。

暂时无法听音频的同学请直接下拉，看相关文字了解本期内容摘要。

音频后期｜陈歆，石头

刚刚结束的AAAI大会上，国内的不少公司都大展身手：百度、华为诺亚方舟实验室、360、携程以及Ipin都放出了大招：

百度-对人力资源实现

人工智能化的管理，

打造公司版“大众点评”？

百度在本次AAAI大会提交的论文名为Collaborative Company Profiling: Insights from an Employee's Perspective 。单从论文题目看，百度似乎在打磨类似Glassdoor的数据集，通过员工对公司的评价和薪资标准，把文本信息和数字信息结合起来。

百度希望通过一个主题模型，提取员工对公司评价的主题词语，比如“加班多”、“奖金少”等关键词，不仅如此，还加入了薪资标准的整合，拟合出不同背景的求职者加入这家公司后的薪资水平可能如何。

百度的这篇paper相比其在研究上的突破，几位嘉宾认为更大的意义在于找到了相关算法一个很好的业界落地点，而由此推断，百度是否在布局一盘在人力资源上更大的棋？比如推出一家公司版大众点评的数据库或者相关新业务也让人浮想联翩。

iPIN-注意力模型在

自然语言处理中的应用问题，

蹭一个研究的热点！

相比BAT，iPIN团队很具神秘色彩，其之前推出的高校就业大数据之AI生涯规划、法律案例检索、招聘岗位匹配人才分析也都颇具亮点和热度，也被选为中国2017最具潜力的创业公司榜首。

本次大会iPIN团队提交的Recurrent Attentional Topic Model则利用了深度学习技术在文档实现建模，增加了句间的语义相关性，不再把每个单词而是用句子作为权重点，简单来说，就是在句子中，给不同的内容加上不同的权重。

iPIN还提出,基于 Topic Model 应用于社会经济图谱研发一个类 Watson 的认知框架，以辅助用户决策。以辅助用户决策。

几位嘉宾在聊iPIN论文过程中也回顾了自然语言处理和Topic Model的发展历史，以及近期相关学术论文的套路，纷纷表示，iPIN这个研究热点蹭的好！

华为-【编码-解码-再现器】

的NMT框架应对翻译问题

华为诺亚方舟实验室的李航团队在今年也提交了论文成果「Neural Machine Translation with Reconstruction」，团队认为虽然端到端神经机器翻译（NMT）在过去两年取得了进展，但一个主要缺点在于 NMT 系统生成的翻译通常缺乏充分性（adequacy），即反复翻译一些单词而错误地忽略其它单词。

为了解决这个问题，华为团队提出了【编码-解码-再现器】的NMT框架，能够显著提升NMT输出的充分性，并获取更好的翻译结果。

几位大咖也对全场最佳paper【物理定理跨越有监督学习到无监督学习的鸿沟】进行了深度解析，还顺带聊了在CMU战胜了德州扑克职业玩家的AI到底意义所在、深度学习框架的横向对比等问题。

不过瘾的同学请点击文末阅读原文跳转至Podcast的5263FM栏目主页，获取完整聊天干货。

你也可以在喜马拉雅搜索【大数据文摘】，订阅我们的音频节目哦。大数据文摘每周一、五分别推出数据新闻播报和数据脱口秀，把最新的数据资讯花式讲给你听，好听到停不下来。

注：

栏目名【5263FM】谐音“吾儿禄山”，梗出自本档脱口秀主编加号的家乡方言。相传杨贵妃随便在大街上认了个帅气的小伙儿安禄山做干儿子，逢人便说是“吾儿禄山”。因此江苏方言中，5263代表“胡扯”、“脑洞大开地聊天”，希望这档脱口秀节目用最轻松的方式把干货认真地聊出来。

关于转载
如需转载，请在开篇显著位置注明作者和出处（转自：大数据文摘 |bigdatadigest），并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑，可直接转载，转载后请将转载链接发送给我们；有原创标识文章，请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者，我们将依法追究其法律责任。联系邮箱：[email protected]。

往期精彩文章

点击图片阅读文章

数据脱口秀 | AI领域你应当关注的14位女性，其中三位是华人