专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
黄建同学  ·  学习-20250205192620 ·  昨天  
宝玉xp  ·  让 Deep Research 提供 ... ·  2 天前  
AI前线  ·  o3-mini之后,OpenAI又紧急上线D ... ·  3 天前  
爱可可-爱生活  ·  《爱可可微博热门分享(2.2)》 ... ·  4 天前  
51好读  ›  专栏  ›  机器学习研究会

【逐云】阿里云高性能计算负责人何万青:做技术的一定要多跨界

机器学习研究会  · 公众号  · AI  · 2017-12-07 22:52

正文

《逐云》是云栖社区的一档人物记录短视频栏目。一共10集。锁定云技术领域,每期记录1位云技术细分领域的代表专家,见证云技术先行者在时代潮流下的选择与追寻、坚持与自由。了解更多云栖专家分享,请点击云栖专家频道,当然我们也欢迎你往前走一步,成为我们的云栖专家(https://yq.aliyun.com/expert),与技术大牛一起“煮酒论英雄”。



本期人物:阿里云高性能计算负责人、资深专家何万青


以下为何万青更多经历:


我不是学计算机的


何万青是做数值计算和AI算法应用的工程热物理博士、YOCSEF荣誉AC,曾在国电电力、摩托罗拉、英特尔、360云和华为工作过。尽管他不是学计算机的,但回顾求学生涯,你会发现他在学生时代,就已经显示出大牛的潜质。


在上海交通大学读博士期间,他就开发出了能实际应用在发电厂的产品。这个产品是国内最早、最成功的产品,不仅论文今天能在网上查到,各个电厂现在也还在使用他开发的产品。由于出类拔萃,何万青很早就“衣食无忧”了——学生期间,他是那届博士中收入最高的。


1999年,何万青带着博士期间开发的产品进入国电电力,开始在北京工作。一段时间后,他跨界来到IT领域——在摩托罗拉做手机DSP软件开发。跨行做IT,在他人眼中或许是充满艰辛的一条路,但在他眼中却显得一切很自然、轻巧。他说:“底层的数学是一样的,只不过今天它是变量,另外一个是已知量而已,然后换来换去。”


虽然摩托罗拉是他IT生涯的第一站,但他在第一站就“开挂”了。误打误撞中,他对“噪声”产生了兴趣,并成功生成人造舒适的背景噪声。而这又让他获得一个专利,成为当时摩托罗拉在技术领域的又一个护城河。


技术大牛往往喜欢具有挑战性的工作,何万青亦是如此,因此他来到了英特尔。在英特尔期间,何万青带出了世界上有名的高性能团队之一,同时他也参与了Xeon Phi和天河2号的优化工作。


对于天河二号,他说这是一段非常紧张、刺激的经历。原因有两点,一个是来自时间期限,错过这个时间后,就赶不上那年的世界第一了;第二个是优化过程中,有各种“疑难杂症”需要面对和协调……经历各种挑战和困难后,他们终于将天河二号推到世界第一。这段坎坷经历之后,“何万青”这个名字后来也出现在美国人写的Xeon Phi异构计算参考书上。


HPC云化是趋势


2017年,何万青来到阿里云。对于为什么来到阿里云,他在访谈中用了四个字来形容——“机缘巧合”。


机缘巧合之下是两方面因素,一是大环境,做云超算的契机已经出现了,云越来越成熟,它让超算普惠成为可能,而这个时候阿里云也需要开发自己的超算产品;其二是个人因素,何万青在高性能计算领域浸淫已达11年,在这样的情况下,他来到阿里云也就成了顺其自然的事情。


被《光明日报》整版刊出的文章《行百里者半九十:2016中国超算大满贯的转折 》中,何万青透露了更多的认知:


1.正如,超算在硬件上的竞争跨越了一定阶段之后,全世界的技术前沿都开始向高性能应用软件和支撑软件上转折发力。一个全面云化、服务化和人工智能的时代,这才刚刚开启。


2.随着大数据和人工智能技术在互联网、自动驾驶、机器人等领域的回暖,新的对计算和数据迁移的压力,使得异构混合集群更成为高性能计算的主流架构。深度学习、神经网络和量子计算的引进成为新趋势。从计算的角度,当前高性能计算技术的阶段,可以总结为一句话:“计算近乎免费,而数据移动是昂贵的。”


何万青认为接下来的技术趋势是HPC as a Service,“大数据时代深层次的分析需要靠高性能计算,下一步要做的就是高性能计算服务上云,将它平民化、普惠所有用户,从而推动中国产业和科研转型,特别是推动中国自己的ISV和软件业走出被盗版和不盈利的怪圈。”


组建团队+产品开发,仅用了半年多时间


在2017年这半年多的时间,何万青不仅快速组建起团队,也把产品——阿里云弹性HPC开发出来,上线并进行公测。上线后,在没有宣传的情况下,有几百家用户已经在估测阿里云的HPC了。


快速将超算云化,除了给阿里云带来商业价值之外,在社会不断进步——大量设计、产品和技术都需要集群开发的今天,也提供了一个非常大的平台,让超算变得更加普惠;与此同时,这也使得国产的超算软件开发有了一个非常好的平台。因为教育这件事情,光靠超算自己是没办法承担的,需要云的方式进一步推进。








请到「今天看啥」查看全文