不知不觉,2017年就要进入尾声了,不知道你在2017年初许下的愿望都实现了吗?
在过去的一年里,我们微软研究院AI头条也在和大家共同进步。在文章内容上,我们精益求精,希望将研究院以及人工智能业界的众多研究成果以既通俗又严谨的方式展示给大家;我们的努力也得到了回报——我们的微信公众号和微博粉丝数双双突破了10万,对此我们充满感激,新的一年也将以此为动力,继续努力。
今天,我们带大家回顾一下2017年微软研究院AI头条的关键词。
在复习结束之后,我们还有精心准备的年终考卷等着你,得高分的小伙伴会有礼物赠送哦!快拿出自己的小本本,我要开始划重点啦!
第一章:突破
作为科研机构,技术突破是立身之本,我们先来看看研究院过去一年都有哪些重要的突破?很重要,必考题哦!
语音识别一直是众多企业和科研机构想要攻占的技术高地,对语音识别准确率的竞争也从未停止。在今年八月,
微软语音和对话研究团队宣布微软语音识别系统错误率进一步降低到了5.1%
,堪称是语音领域新的里程碑,
准确率甚至超过了专业速记员。实现识别准确率上的“人类对等”是语音识别领域过去25年来一直奋力追求的研究目标,微软始终坚持深耕技术,并将新突破最快、最好地运用到Cortana、Microsoft Translator、Microsoft Cognitive Services等微软产品和服务中,让用户能够亲身体验新技术的魅力。
在机器阅读理解方面,大家想必对由斯坦福大学自然语言计算组发起的SQuAD(Stanford Question Answering Dataset)文本理解挑战赛并不陌生,它也被誉为“机器阅读理解界的
ImageNet”
。诸多来自全球学术界和产业界的研究团队都积极地参与其中,
微软亚洲研究院的自然语言计算组一直在SQuAD文本理解挑战赛中持续稳居榜首
,和众多业界同仁们并肩努力,推动着自然语言理解的进步。
第二章:创新
技术突破的背后是研究人员夜以继日的努力和从不间歇的创新,每一小步的探索都可能推动科技未来的巨大进步
。
计算机视觉方面在过去一年硕果累累。
在艺术风格化方向,微软亚洲研究院发布了最新研究成果
,其中既有新风格
迁移算法“风格基元”的提出,也有为了解决视频风格转化过程中的抖动问题提出的端到端的在线视频风格迁移模型,还有针对图像视觉特征迁移问题提出的Deep Image Analogy算法。
视觉计算组的研究员在今年发表在arXiv上的论文中
首次在卷积神经网络中引入了学习空间几何形变的能力,得到可变形卷积网络
,更好地解决了具有空间形变地图像识别任务。来自微软亚洲研究院多媒体搜索与挖掘组有关
深度三维残差神经网络的研究成果
发布在了今年的ICCV大会上,通过该网络学习到的视频表达在多个不同的视频理解任务上取得稳定的性能提升。
在机器学习领域,今年微软亚洲研究院机器学习组共有4篇文章发表在NIPS上,分别关于机器翻译、
GBDT和强化学习
。其中有关机器翻译的两项工作着眼于把解码过程做得更精细,分别引入了
价值网络
和
“推敲”
的思想;GBDT的利器LightGBM已经开源了几个月并在GitHub上积累了4371多颗星;有关强化学习的工作解决了在non-iid的情况下进行policy evaluation的重要理论问题。
第三章:融智
科技发展的最终目的还是能让更多人的生活和工作变得更舒适、便捷、高效,因此让高端的科技智慧融入到众多的产品中,最终再走到人们的日常工作生活中,也是我们不懈努力的动力。
在今年七月,
Microsoft Translator通过微软车库项目发布了
全新的
演讲实时翻译字幕功能
Presentation Translator
,只需在PowerPoint上安装一个插件,大家就可以直接用中文母语进行演讲,观众则可以选择自己语言的翻译字幕。
年末之时,微软在
旧金山举办了一场“Everyday AI”发布会
,会上主要发布了必应搜索引擎、微软小娜、Office 365和Seeing AI四种工具和服务的更新功能,更新后的工具借助人工智能服务帮助人们更巧妙地获取信息,满足人们更复杂的需求,给人们每天的日常生活带来有益的改善。微软Office 365发布了Excel新的预
览版, 该版本引入了
Insights in Excel功能
,
用户只需要用Excel打开电子表格并点击Insights按钮,机器就能够在短时间内自动分析表格数据、捕捉数据之间的关联、挖掘数据中蕴含的洞见、并推荐简洁明了的图文分析结果,该功能背后的核心技术就来自于微软亚洲研究院软件分析组。
第四章:工匠精神
所有研究成果的背后都是众多研究人员数年如一日的坚持和追求,他们身处变化节奏最快的人工智能领域,却始终保持着十年磨一剑的专注态度,用一个个扎实的脚步探索着人工智能科技瞬息万变的最前沿,这也是他们对“工匠精神”的演绎。
微软亚洲研究院
主管研究员许继征是视频压缩标准HEVC的“幕后英雄”
,多年来精专于数字视频相关的技术工作,HEVC和屏幕视频编码标准相关的6项关键技术中,有5项出自微软亚洲研究院之手。
全球第一个提供分布式图数据库服务的Azure Cosmos DB中负责处理图的数据库核心来自
微软亚洲研究院主管研究员陈亮
。在多年的研究经历中,他坚持独立思考,保持自己独一无二的创造力。
室内导航系统寻路的幕后技术推动者是一位年轻的研究员舒元超
,他会时刻关注领域的前沿和学科的交叉领域,在他看来,做研究的理想状态就是:既能耐得住寂寞,安静下来做研究、发论文;又能高效与人沟通、协作,让技术真正落地。
微软亚洲研究院被业界誉为IT界的“黄埔军校”,我们更愿意相信它代表着这里是一个适合研究人员成长和成功的地方,人是企业中最重要的部分,也是最重要的资源;
伟大的公司永远不是因为一个人而伟大,而是因为一群人
。
第五章:院友
伟大的公司是因为一群人而伟大,这群人里当然也少不了从研究院走出、如今早已成为各领域翘楚的院友们。
在第二届微软亚洲研究院院友年度大会上,院友们围绕金融、计算机视觉、智能驾驶、未来人机交互等几个话题进行了探讨交流。活动中,微软亚洲研究院的几位前任院长、副院长——创新工场CEO李开复、源码资本合伙人张宏江、海尔集团CTO赵峰、硬蛋CTO李世鹏坐在一起,畅聊
当前人工智能创业、如何拿到融资
等一系列热门问题。
经济学家、清华大学国家金融研究院院长、原IMF副总裁
朱民在会上分享了关于世界金融群和市场波动的看法
。在热门的计算机视觉话题上,微软全球执行副总裁沈向洋与5位微软亚洲研究院的院友:商汤科技联合创始人兼CEO徐立、旷视科技创始人兼CEO印奇、旷视科技首席科学家孙剑、中科视拓的董事长兼CTO山世光、依图科技业务技术副总裁吴岷共同
探讨了计算机视觉领域的发展现状和未来的挑战
。
打造院友会就是想在研究员与院友之间以及院友与院友之间建立起一座沟通的桥梁,这里承载的是每一位院友的“母校”情节,也凝聚着每一位院友对微软亚洲研究院的感恩与热忱。
第六章:合作
毋庸置疑,让研究成果在各行各业落地,离不开合作伙伴的鼎力相助,协作共赢也是我们一直以来倡导的理念。2017年,微软亚洲研究院通过与不同领域的伙伴进行合作互助,收获了很多惊喜。
在金融领域,我们和华夏基金在今年六月共同举办了战略发布会,宣布双方将就
人工智能在金融服务领域的应用展开合作研究
,希望让人工智能真正造福投资者,并且驱动金融产业的技术变革。
在与学界的广泛合作中,北京大学、微软亚洲研究院和电子科技大学的研究人员联合开发了一种可以在没有用户干预的情况下
全自动修复软件系统缺陷的新技术ACS
,目前其修复正确率和修复熟练都取得了缺陷修复基准数据集Defects4J上的最好结果。
在城市计算方面,我们
利用摩拜自行车提供的轨迹大数据尝试挖掘更有效、更合理的自行车道建设
,希望大数据和人工智能这些新兴技术能帮助我们打造一个更加便利、美好和智能的生活环境。
今年年底,
微软亚洲研究院宣布成立了“创新汇”
,旨在以微软亚洲研究院的顶尖科研智慧和微软丰富多样的创新技术为基础,与不同行业、不同领域的现实需求接轨,打造一个借科技之力帮助企业和机构提升生产力和商业价值,并推动行业实现创新发展的平台。
第七章:关怀
对人的持续关注与关怀让我们的所有研究都有了温度和意义。
过去一年,微软向“宝贝回家”志愿者协会提供了微软亚洲研究院研发的人脸识别技术,
用于帮助更多家庭找回走失的孩子
,业淞是第一个借助“回家”软件被找到的走失儿童。今后,微软将继续与宝贝回家志愿者协会进行更全面深入的合作,同时不断优化“回家”程序,让希望这个应用能帮助更多家庭找回走失的孩子。
另外,微软研究员张海燕与设计师、帕金森病患者Emma Lawton合作,一起开发了一款特殊的手表 The Emma Watch(Emma手表),用以
帮助帕金森病患者克服手部的震颤,像正常人那样写字画画
。
第八章:量子计算
过去一年,我们也在时刻关注着AI领域的新鲜事物和热点事件,例如目前大热的量子计算,努力走在科技的最前端。
2017年的9月,
微软开发出首个拓扑量子位,发布了为驾驭规模化量子计算机而专门优化的新的编程语言,让开发者能够编写量子程序
,在当前的量子模拟器上调试,并能够在未来真正的拓扑量子计算机上运行。我们认为强大的量子位将成为可扩展、通用量子计算系统的基础,这将是量子物理学领域一次意义深远的突破。
12月,
微软又发布了“量子开发工具包”的免费预览版本
,其中包括专为量子计算开发的Q#编程语言、一款量子计算模拟器,以及能够帮助到量子程序开发者的其他资源。在理论物理学家Richard Feynman提出量子计算概念的50多年后,量子理论正一步步走进现实。