张冬梅 微软亚洲研究院首席研究员
作为D&I
文化
(Diversity and Inclusion,多元与包容)
的倡行者,微软一直支持女性员工释放潜能、施展才华。国际劳动妇女节就要到了,借此机会,小编把身边才华横溢的女同事介绍给大家,分享她们在科研上的突出成就,聊一聊在工作和生活中的那些事。
今天,就从张冬梅博士的 13 年微软生涯开始吧!
13年前,2004年的那个夏天,张冬梅坐在回国的飞机上,思忖着即将到来的新生活,有着几分期许,也有几分兴奋。“回国前不知道会发生什么,会和什么人工作,很多东西都是未知的。”张冬梅如是说道。那时的她,正准备加入微软亚洲研究院。
光阴如白驹过隙,13年后的今天,张冬梅已经成为微软亚洲研究院首席研究员,她带领的软件分析组(Software
Analytics Group)成绩斐然。他们通过与微软Power BI产品组的合作,将“快速洞察”(Quick
Insights)、“信息图设计”(Infographic Designer)等技术成功地转化到Power
BI产品中。同时,两个团队下一步的合作更是为Power BI构建了良好的产品愿景,让该产品在商业智能(Business
Intelligence,简称BI)领域最权威的报告之一 —— Gartner魔力象限(Magic
Quadrant)2017中身居领导者象限的高位,并在未来布局能力(Completeness of Vision)上一骑绝尘,领先所有厂商。
事实上,正是由于张冬梅博士带领的微软亚洲研究院软件分析组的研究,让微软在智能数据发现(Smart
Data Discovery)这个前沿领域实现了从无到有,从“零”到“领”的突破。这项来自于研究院的前沿技术研究也为Power
BI展示了清晰的未来布局方向。说起这个话题,张冬梅十分自豪。而令她更为骄傲的是她所带领的团队。这是由一群追求完美不知疲惫、对技术的热情多年来只增不减的研究员们所组成的“梦之队”。
对于张冬梅博士所带领的软件分析组而言,研究工作涉及到多个领域以及它们的交叉和合作。
软件分析组以软件和系统在开发、运行、维护整个生命周期中的问题作为研究对象,研究课题主要围绕以下几个方面:一是软件系统的质量(Quality),如可靠性、性能、以及安全性等;二是用户体验(Experience),如用户界面、用户使用方式、以及用户黏度等;最后是软件的开发效率(Productivity)。软件分析是一个大数据分析、机器学习与软件系统学科相结合的交叉研究方向,
这就需要研究团队在大规模数据的存储与计算、数据挖掘、机器学习、软件学科以及信息可视化和人机交互等多个研究领域内有深厚的基础
张冬梅博士说:“日常工作中,我们使用大数据分析、机器学习和信息可视化技术来解决软件系统和在线服务的生命周期中的各种问题;同时,这些在实际生产实践中遇到的问题与挑战也为我们在大数据、机器学习、软件学科等方面的基础算法和理论的研究提供问题和灵感。事实上,包括‘Quick
Insights’在内,我们有很多研究课题与项目设想都是基于这种理论与实践相互作用的过程中产生的。”
一般情况下,研究组内会有多个项目同时展开,每个项目的规模不会太大。做一个人人投入的项目,把项目做到应有的规模,这是张冬梅一直酝酿着的一个想法。2014年11月,随着Quick
Insights项目(内部代号:IN4)的开始,她的想法逐渐成为现实。所谓IN4,指的是INteractive(互动)、INtuitive(直观)、INstant(瞬时)和INsights(洞察),这也代表了这个项目的目标:打造出一种交互式、直观、快捷的分析数据获取洞察的方式,为用户提供全新的数据分析体验。
如今的大数据时代对数据分析产生了很高的需求,这种需求不仅仅局限在软件领域,各行各业都会有。虽然商业智能在过去几十年内实现了快速发展,市场上已经存在不少相关工具,但张冬梅团队发现了一个有趣的现象:在用户使用这些工具的过程中,用户总是处于主动的位置,而工具总是处于被动的位置。例如,工具只有在用户进行查询时,才会调取数据告知相应信息,再根据用户制表画图等要求进行相应操作。在这个过程中,工具本身并不会主动分析提取数据中的信息,并向用户进行展示和推荐。这样的发现让团队开始思考:为什么不能让这些工具更加智能,让工具在交互中根据用户的需求变得主动呢?
这样的展望让团队成员一拍即合,决定开启IN4项目。面对多维度、大规模的数据,如何让系统自动搜寻有趣的数据特征,即所谓的insight(洞察),是团队在项目最初阶段面临的重多挑战之一。要解决这个问题,团队需要回答更多问题,比如说,什么是insight?(需要一个严谨具体的定义)如何挖掘数据?(需要一套高效的算法)挖掘出
insight 后如何向用户表达呈现?如何用自然语言描述?这些具体问题让团队成员逐渐聚焦四大关键技术:Excel
Magic(元数据理解),Auto Insights(insight 挖掘),MetroEyes(双向交互)和Power
Story(insight描述)。根据这些具体的技术需求,张冬梅将团队分为多个小组,大家同时开展研究。
因为IN4的研究目标是提供端到端的数据分析服务系统原型,所以针对任何一个要素,研究员都需要一边做技术研究,一边做工程设计。从2014年11月到2015年3月,这短短的5个月时间,对每个研究员来说都是一段紧张而难忘的时光。张冬梅尤其记得当时每周五组会,大家聚在一起汇报各小组进展。作为压轴节目,负责交互设计和系统集成的研究员侯志涛会将大家的成果汇总进行演示,那时大家最经常说的一句话就是:这是我们想要的效果么?如果答案是否定的,接下来就会是进一步的讨论、反馈和改进。周周如此,周而复始。
时间快进到5个月后,2015年3月。在微软总部举行的技术节(TechFest)上,软件分析组首次在公司内部展示IN4。就在这场R(Research
研究)与D(Development 产品开发)的交流活动上,IN4项目和Power BI首次相遇,并被Power
BI产品团队一眼相中。时任Power BI工程总监的Nick特意改变行程与张冬梅的团队开会,并表示出强烈的合作意向:Power
BI需要这样的能力,让我们两个团队一起来完善它。