专栏名称: AI数据派
THU数据派"基于清华,放眼世界",以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯,定期组织线下活动,分享前沿产业动态。了解清华大数据,敬请关注姐妹号“数据派THU”。
目录
相关文章推荐
人生研究所  ·  他嫌弃你时的生理反应 ·  4 天前  
51好读  ›  专栏  ›  AI数据派

爱AI:当520遇上Alexander Waibel和Hans Uszkoreit

AI数据派  · 公众号  ·  · 2018-05-22 07:30

正文


今年的520,天公作美,毛毛细雨,是适合浪漫的好天气。人工智能在过去60年,10多年一次起伏,这一波也赶上了好时候,得到了全球范围内前所未有的瞩目。其中语音识别和自然语言处理是其中最重要和最复杂的方向,也是实现智能应用的重要组成部分。


《AI创新讲堂》 第二讲 由中国人工智能学会与清华大学的数据科学研究院、校友三创大会、学生职业发展指导中心的Coach计划联合主办,邀请了语音和自然语言处理顶级大咖—— 卡内基梅隆大学(CMU)教授 Alexander Waibel 欧洲科学院院士、德国人工智能研究中心(DFKI)科学总监 汉斯·乌思克尔特 ,为大家分享语音与语言处理领域的最新进展与挑战。


活动开始,清数大数据产业联盟秘书长、清华校友三创大会执行秘书长王霞代表主办方致欢迎辞。



Waibel教授的学生、现人民大学金琴副教授友情主持并与嘉宾进行了对话讨论。



Alex Waibel演讲的题目是“Intelligent system and a language transparent world”。Waibel教授一直以来的梦想就是能够通过技术让每个人在任何时间任何地点与地球上任意一个人自由的沟通,并一直在为之努力。Waibel教授在1978年就发明了世界上首款语音翻译器,在1991-1992第一次实现了语音翻译视频会议,并且创造了第一个商用的语音翻译应用Jibbigo。Waibel教授回顾了自己和实验室过去几十年的研究经历,从规则和专家系统时代、到神经网络、到统计模型,到今天的深度神经网络。


由于计算能力和存储能力的提升,深度学习使得旧模型有了新生命,Waibel教授在上个世纪80年代的很多神经网络的工作在今天又得到了广泛的使用,比如TDNN和Pi-Meta模型。Waibel教授把最新的多语言翻译和同声传译系统用到了欧洲议会,大大降低了议会翻译的工作量。另外,该技术还用在德国大学的课堂上帮助外国留学生尽快融入德国新的学习环境;更重要的,还用在人道主义援助中,帮助医生为难民提供医疗健康服务。


Waibel教授强调未来多种模型交互和学习的重要性,这是由对于儿童学习语言、视觉、触摸、交互等能力的观察。Waibel教授还强调,由于语言的多样性和复杂性,语音语言处理比起人脸识别困难得多。7000多种语言,需要艰苦卓绝的工作,虽然对于主流语言已经取得了不错的成果,但长尾部分大量的小语种需要行业内的工作者共同努力。



在讨论互动环节,主办方代表王霞向Waibel教授请教他作为一个很优秀的学者和教授,同时又成功的创建了10个公司,包括被Facebook收购的Jibbigo,在科研成果转化方面有什么秘诀。Waibel教授认为,他和团队发现,从来不要以赚钱为目标去从事一项事业,无论是研究还是创业,都是以解决某个问题为最基本的出发点,当你解决了这个问题,为别人带来了有用的产品,经济上的成功是顺其自然的副产品。




关于前CMU学生秦龙的问题,“神经网络模型还能在语音识别领域持续多久的辉煌”,Waibel教授认为,神经网络还有很大的能量没有发挥出来,比如说,目前我们的神经网络还不具备自我学习能力,不具备从错误中学习的方法。再比如说,目前我们的神经网络还只能在限定的问题上实现,比如我们要训练一个会下象棋的模型,但是想要下围棋,那么要重新训练一个下围棋的模型,神经网络还不具备通用学习的能力。而这些方面,都是很好的发展方向。


汉斯 乌思克尔特博士演讲的题目是“From Information Extraction to Partial Language Understanding”。他首先介绍了工业4.0的重要性及其组成部分,包括信息物理系统(CPS),数字孪生体(Digital Twin), 柔性生产,智能自动化,智能流程优化等。然后乌思克尔特博士介绍了如何从信息提取上升到理解,以及DBpedia这个巨大的知识库和知识图谱。DBpedia中有超过30亿个知识点,远超同类型的数据库。DBpedia可以应用到很多领域,比如可以用来提供更加精细的搜索反馈,乌思克尔特博士因此获得了Google重点研究奖。



关于如何防止DBpediatric受到网络上大量虚假新闻的影响的互动话题,乌思克尔特博士表示,目前的DBpedia,在系统生成知识点的最终一步,还是需要一定的人为审核过程,防止受到虚假新闻的影响。Waibel教授与联想集团副总裁徐飞玉博士也就这一问题积极参与了讨论。


Waibel教授与乌思克尔特博士还接受了大数据文摘与数据派的专访。专访内容稍后发布,请关注。




本次AI创新讲堂由清数D-LAB,清华校友总会AI大数据专委会、中国科技产业化促进会AI大数据专委会、清数大数据产业联盟承办。



清华 - 青岛数据科学研究院

清华-青岛数据科学研究院由清华大学于2014年4月26日成立。以国家大数据体系建设需求为导向,依托于清华实力过硬的理工科背景,数据科学研究院的成立旨在促进学科融合创新,服务国家战略(政),推动产业发展(产),培养领军人才(学),引领一流科研(研),促进技术创新应用(用),打造中国大数据最强集团军。数据院的三大任务分别是人才培养、科学研究和品牌传播。







请到「今天看啥」查看全文