专栏名称: UBStore
UiBot,流程自动化专家,致力于打造中国最大RPA共赢生态。产品专注于财税、金融、保险等各行各业流程自动化解决方案制定和实施,并提供业务咨询、设计实施、自动化业务开发培训等服务。
目录
相关文章推荐
地理蹊  ·  考前每日练 | ... ·  昨天  
地理蹊  ·  “双11”网购包裹上高铁啦! ·  3 天前  
地理蹊  ·  地理赏析 | 獬豸之城‌,福建连城 ·  6 天前  
地理蹊  ·  教学地理 | 自然环境的整体性(一) ·  5 天前  
地理蹊  ·  考前每日练 | ... ·  4 天前  
51好读  ›  专栏  ›  UBStore

杨强教授:用联邦迁移学习打破数据墙

UBStore  · 公众号  ·  · 2019-09-03 20:02

正文

本文要点:

1. 联邦学习就好像是我们在一起写一本小说,一起沟通进度,但是你看不到我写的,最后我们合起来是一本完整的小说


2. 联邦学习这种机制,主张交易价值,而不是交易数据本身。


3. 我觉得我在企业里每天都是一个小学生,我是很快乐的。


4. 是不是我们的企业都要不断地去研究新算法呢?我觉得需要,但是没有必要。


5. 企业要把AI落地,需要一个很重要的岗位叫AI产品经理。


6. 深圳真的是科技铸造的一个城市,现在正是深圳科技发展的好时代,所以说来也真的是来对了。


7. 中国最大的优势就是有我们这样的一批人存在。


2019年8月23日,来也科技南区开业,杨强教授莅临开业现场,与来也科技CTO胡一川展开一轮科技前沿的对话。



以下是对话实录:

胡一川:

今天非常荣幸能够邀请杨强教授来参加来也科技南区的开业。杨教授是来也的老朋友了,杨教授能不能先介绍一下您跟来也的渊源呢?


杨强教授:非常荣幸,祝贺来也南区开业。非常高兴在深圳又多了一个老朋友,之后我们可以一起工作,一起奋斗。


跟来也的结缘是这样的,我长期以来从事人工智能的研究,一个很巧合的机会,当时我们在进行一个人工智能强化学习方面的研究,做一个智能音箱的对话系统,也就是做一个自动的Chatbot技术。我们做得很早,当时国内还没有像今天这样,没有大公司在做。所以,我当时就惊讶来也是正在做这个方向的一家公司。因为这个机会就把我们带到北京来也公司,当时是在知春路上的一个小楼里面。


刚开始上去以为走错了,走到哪个居民区去了。结果敲开门发现里面好热闹,我们非常惊讶地发现,来也能够把这些客服人员的工作当做一个强化学习的算法。这个算法里有各种角色,他们所进行的一系列操作都是很规整的,按照强化学习的方法来做的。


到现在,来也用强化学习、机器学习来做RPA+AI,我觉得是非常自然的一个走向。


胡一川:

对,杨教授刚刚回顾的是三年前,来也成立的第一年,他去我们当时一个不足50人的那种商住两用楼里拜访我们的情况。我们也非常感谢杨强教授在过去几年里对我们来也科技的帮助与支持。接下来我们来聊一聊杨教授的最新工作。


我们关注到您在微众银行带领AI团队在联邦学习这样一个前沿方向做了一系列的工作。联邦学习这个概念对于今天在座的各位相对来说是一个新词儿,请您给我们介绍一下联邦学习。


杨强教授:大家在座的或多或少都在进行人工智能的工作,像来也自己在做RPA+AI,其实,不管是什么人做什么样的工作,只要是面向市场,都会面临这样一个场景,就是多方参与。这个多方参与的情况是一个非常棘手,非常不一样的情况。


尤其是像微众银行这样一个互联网的银行,有上百家合作方。我们一起为一个用户建立画像,但在建立的过程中,就会面临非常棘手的问题,就是数据不够。那么这个大数据在小银行的场景下,就没办法使用一些好的工具,比如深度学习。这个情况怎么办呢?


过去的做法是,在市场上大家把数据汇聚到一起来;但是现在呢,大家不便把数据共享,有政府监管方面的原因,也有大家对于隐私、安全各方面的考虑。我们知道,在一些大厂里,各个部门的数据互相之间也不互通。所以,就有人说深度学习受到了很大的威胁,人工智能也会因此衰落。但我不这样认为。


我认为,这对人工智能来说其实是一个新的机会,我们现在做“联邦学习”这样的工作,就是把各方看作一个联邦,然后让他们去共享这样一个模型。这个模型是依据各方数据来做的,但是建立这个模型的过程中,各方数据都在本地,只是大家在沟通的过程中分享一些加密参数。这就好像是我们在一起写一本小说,我们一起沟通进度,但是你看不到我写的,最后我们合起来是一本完整的小说。所以在这样的一个状态下,既可以满足大家的需求,也可以消除大家对于数据安全的恐惧。并且,我们发现在金融、医疗等行业都存在类似的问题,有对这个技术的需要。我觉得这件事情,是很有必要做的,所以我们也在致力于推进。



胡一川:

今天AI要发挥它的能力,需要依靠大量的数据来支持。但其实很多时候数据是在不同企业中。这个时候联邦学习提供了一种机制,让大家不用去打通和共享数据就能够共同训练一个强大的AI模型。那接下来的一个问题是,我们怎样能够有效地让企业之间能够很好的合作,有没有一些相应的办法和机制来实现?


杨强教授:这个问题问得非常好。现在这个社会,并不是技术完善到百分之百,它就能自动地做什么事。就比方刚才说到的联邦学习,就是这样一个例子。首先,它不仅需要技术方面的创新,同时需要建立一个经济机制、建立一个经济市场,大家加入这个市场并且都能受益,才能吸引大家不断地加入。过去,当大数据的价值被意识到,各地的大数据交易所如雨后春笋般出现。但今天我们再回过头来看,大数据交易所并没有如我们预期的发展起来,主要原因是大家觉得交易数据是存在阻力和压力的。那通过联邦学习这种机制,我们主张交易价值,而不是交易数据本身,这引起了很多人的共鸣,包括政府。目前,我们和政府一起在建立一个国家标准,我们在国际上也在建立一个国际标准,也在吸引一些欧盟的人、美国的人加入。希望大家能够多关注,希望这样的技术可以推到每个行业。



胡一川:

我理解这个的标准在某种程度上像互联网时代的TCP/IP协议,让所有计算机用同样的方式实现互联互通。那么我们怎么来定义数据的价值呢?


杨强教授:那其实这个也是很奇妙的,有点像区块链早期的样子。不同企业有不同的喜好和价值体系,所以需要我们去完善这个机制。但是它是一个分布式的体系,需要依赖博弈论来帮助建立的相关的机制。那么博弈论来帮助建立组织,这个也是有先例的。比如说在国际上用博弈论经济学来驱动市场;再就是不同的运营商之间交换无线通信的频率,这样的经济模型机制都是非常领先非常成功的,这些其实都为我们现在的工作做了铺垫。


胡一川:

嗯。杨教授您能不能介绍一下今天的联邦学习在微众银行有没有什么落地场景,它带来什么样的一些价值?


杨强教授:对,是有很多落地的场景的,其中一个场景就是在计算机视觉。我们跟一个视觉公司合作,目的是去监测工地工人的工作状况。但是每个工地并不想把工地的监控数据进行共享,因此我们就用联邦学习和计算机视觉,在实现监测的同时,又能保护隐私。


还有一个就是我刚才提到的再保险。再保险是保险公司需要知道一家公司的经营状况,而这些信息可能在不同的保险公司中,保险公司之间也是有竞争的,所以就需要在不共享数据的情况下实现共同来训练再保险的模型。


胡一川:

好的,其实就是刚才杨教授介绍的那样,联邦学习主要解决的问题是:AI需要大量数据才能训练出好模型,但企业之间并不共享数据,在这种情况下,怎样通过一些机制和一些方法,来打破这样的困境。其实像我们来也科技现在运用的RPA技术,也是打通企业内部各软件系统,实现服务自动化。


好,那我们进入到下一个话题。我们就是一直在做的事情是助力每一家企业实现人机协同。我们的四位创始人都是技术背景出身,其中三位是在博士毕业之后就开始投入创业,包括您自己也经历了从学术界到工业界这样一个身份转变,那么在您看来,这个过程中最需要学习的是什么呢?


杨强教授:我觉得我在企业里每天都是一个小学生,我是很快乐的,因为学习是一件很幸福的事。在工业界,首先是要明确目标,怎么衡量一件事情做的好坏,在机器学习里这叫目标函数,一个好的目标函数很重要。在学术界目标可能是发一篇论文获得很高的citation,但在工业界目标是很不一样的。


其次,是周边要还有一个好的朋友圈,这个朋友可以是各色各样的。


最后,是你要学会合作,而且有的时候一个既合作又竞争的状态,这是一个非常有趣的事情。我也还在学习当中


胡一川:

对,那像今天来到现场的我们的很多的合作伙伴,包括我们各行各业的企业,大家其实都非常关注在自己的企业如何让AI落地。那就是您的角度来讲,如果一个企业它自身没有特别完善的AI研究或者研发的体系,那么这个时候企业应该怎么做?怎么去发展怎么去落地呢?


杨强教授:其实,现在看一下AI的教科书或者AI界前沿的一些技术,我们已经有很丰富的工具包。是不是我们的企业都要不断地去研究新算法呢?我觉得需要,但是没有必要。


企业要把AI落地,需要一个很重要的岗位叫AI产品经理他能够发现业务中存在的问题,并且知道能用什么样的AI工具包来解决这个问题,能找到人去实现它,最后能够衡量AI带来的价值。比方说,RPA也好,联邦学习也好,到最后都变成一个可衡量的标准,这个标准可以用减少了多少工作量来算,也可以用它的价值来算,这就是AI产品经理的价值所在。


胡一川:

这一点就是说AI产品经理这个新的角色,他需要在了解技术的同时,也要能够知道业务方的需求。好,那这个今天是来也科技南区开业的启动仪式,那您对来也科技来到深圳有没有什么样的建议,您觉得到了深圳之后会有什么样的惊喜呢?


杨强教授:我觉得来也科技来得正是时候。这个周末中央刚刚把深圳定位为示范先行区,然后来也就来了,真是来对了,非常非常好。


深圳真的是科技铸造的一个城市,现在正是深圳科技发展的好时代,所以说"来也"真的是来对了地方。大家都各自发挥各自的优势,去助力科技发展。最近刚成立了大湾区人工智能与机器人联合学会,包括广东省人工智能与机器人学会,香港人工智能与机器人学会,澳门人工智能学会希望来也科技的加入可以助力大湾区的科技发展能够更上一层楼。


胡一川:

非常感谢杨教授的肯定,希望来也科技在大湾区能够有很好的合作。那其实最后一个问题是顺着您的话题,就是我们都知道您这个致力于研究人工智能30年,最早在美国然后加拿大后来又到了香港再就是现在深圳,那其实很自然地就是联想到最近这段时间大家都会问有这样一个问题,就是在人工智能的时代,您怎么看今天中国和欧美的区别或者说中国有什么样的优势?


杨强教授:目前我觉得中国最大的优势就是有我们这样的一批人存在。那像我,我平时喜欢坐地铁,一到地铁上看到的都是年轻人。所以我对深圳这个地方非常非常有期望,她非常有朝气。但是我觉得另一方面,人工智能也好,科学也好,这个都是有基因的,需要大家不断地去努力去学习,这个方面大家要继续努力。像AI落地,这就好像一个技术的落地实现,需要相应的架构和管理机制的建立。也许这个具体的方法论就会在深圳这块土地上发展起来的。


胡一川:

对,感谢杨教授的分享。确实今天也能明显感受到这个AI的突破,这个AI的落地呢,无论是从这个落地的速度还是广度,我们都是超过欧美的。我个人特别看好中国AI技术,尤其是在深圳这样一个科技中心的发展的。


观众:

杨教授您好,我刚才听了您的分享。我是搞软件开发的,以前是做企业管理系统。刚才我听了您讲的这个协议,对这个东西感兴趣。为什么这样说呢?这个协议如果成功了,那么我们所有公司的客户都得到了照顾,也都适应这个机制,那么到时候这个社会也好,或者说公司的价值也好都是不成问题的。所以我想问您,这个协议我们是基于哪些方面去构建,怎么样达到国家的标准,怎么样达到国际的标准呢?这个想了解一下,谢谢。


杨强教授:这个问题问得非常好。如果能够构建一个有效的协议,那么就像一个项目一样,人和人之间的沟通就好像企业和企业一样。首先呢它要有一个字典,这个字典就是代表一个标准;其次是这个字典里用的语法,就是说什么样的沟通是合法安全的,然后给安全定级,安全和效率挂钩,就是说你如果过于安全,肯定效率受影响,所以就可以分成几个安全级。如果满足某个安全评级的话,那对应的效率就是可以查得出来的。所以在两个企业合作的时候,他们可以根据制定的标准,用一些算法体现出效果和效率。然后在建立这个标准的同时,建立起这样典型的案例,就可以在各行各业,在医疗领域、在教育领域、在金融领域、在保险领域或者说在无人车领域等都可以培养。


END