“我们要做无人驾驶车的大脑”,AutoX创始人肖健雄在斯坦福AI活动上介绍道。神秘的AutoX终于揭开一缕面纱,向斯坦福师生展示了他们在自动驾驶上的一部分前沿技术突破。
这次活动由硅谷最大的华人背景的创投基金之一丹华资本(DHVC)和斯坦福华人创业者协会(Chinese Entrepreneur Organization)主办,硅谷密探提供媒体支持。
肖健雄去年从普林斯顿大学计算机系离开(人称Professor X),创办了无人驾驶公司AutoX。作为80后计算机视觉领域的学术新星,肖健雄2012年获得世界顶尖计算机视觉大会ECCV最佳学生论文奖,2012年获Google Research最佳论文奖,2013年获得麻省理工学院博士学位。他在PhD毕业后直接担任美国普林斯顿大学计算机科学系Tenure Track助理教授,并从零开始创建了普林斯顿计算机视觉与机器人实验室。
在普林斯顿期间的短短三年时间,他发表了三维深度学习的一系列奠基性论文。由于他的杰出学术贡献和世界级影响力, 他两度获得Google Faculty Awards,多次获得Intel Research Awards 和美国国家自然基金委员会研究奖。他的研究成果被广泛应用到自动驾驶和机器人等相关领域。2016年他领导的普林斯顿团队和麻省理工学院联合获得了Amazon Picking Challenge机器人大赛世界第三和第四名。
在肖健雄看来,无人驾驶会是继PC、互联网、智能手机之后的“Next Big Thing”,他认为无人驾驶行业将会有传感器提供商、汽车制造商、计算设备提供商等,而AutoX致力于提供无人驾驶的软件系统,他希望成为AutoX成为无人驾驶时代的操作系统,就像智能手机时代的Android,PC时代的Windows。
肖健雄带领的团队在计算机视觉和无人驾驶领域有深厚积累,他们目前的解决方案覆盖了自动驾驶领域的环境感知、规划以及最后的控制的阶段。AutoX虽然创立短短5个月,但是在技术上取得了一系列的重大突破。
肖健雄在活动中演示了他们的自动驾驶系统的路测视频。
(图片来源:Jason Sun)
最后他也不忘强调他们还在招聘,各位有志之士可以考虑加入。
本次Stanford AI Mixer活动还有三家人工智能公司创始人的分享,都是丹华资本旗下所投公司。
Pilot.ai是一家利用深度学习等技术做计算机视觉的初创公司,他们的一大特点是能够运行在嵌入式设备上。
Pilot.ai创始人Jonathan Su表示他们的计算机视觉方案已经应用在了无人机、零售行业、以及辅助驾驶等领域。
目前他们的年收入超过一千万美元,并准备进入安防、智能家居、工业自动化等领域。
Loom.ai是一家初创的人工智能公司,他们开发了从单个图片生成3D Avatar(三维头像)的技术。这项技术结合了计算机视觉、机器学习和电影业的高端特效。
(利用左上方图片形成的3D形象)
Loom.ai联合创始人兼CTO Kiran Bhat帮助建立了Lucas Film的面部捕捉系统,并且是复仇者联盟和加勒比海盗这两部电影面部效果的研发负责人,并且荣获2017年美国电影艺术与科学学院颁发的奥斯卡科技成果奖。
Kiran Bhat在现场演示了他们的酷炫的新科技,这项技术有望应用于游戏、VR、社交、电子商务等领域,用来提供个性化的用户体验。
AISense创始人Sam Liang介绍了他们的创业公司正在开发的环境智能语音平台,Sam Liang此前创办的Alohar Mobile被阿里巴巴收购。
AISense这个平台将会有众多潜在的应用,比如用于自动笔记记录、移动客户管理系统、个人搜索引擎。
在最后的问答环节,四位创始人围绕人工智能的话题回答了众多斯坦福学生的问题,讨论了人工智能创业以及人工智能对生活的影响等问题。
本次活动主持人、来自CEO的斯坦福计算机系PhD学生同时也是丹华资本EIR的阮珊珊(Sherry Ruan)表示,“这次活动是CEO近年来规模最大的创业面对面活动之一。本次活动四家极具代表性的AI公司创始人们向观众们进行展示为主并辅以一对一交流,参加者们纷纷表现出了极大的求知欲,热情和参与度。”
活动后我们也采访了丹华资本董事总经理Dovey Wan,问了她最看重的2016年的AI技术进展:
“个人觉得是GAN(Generative Adversarial Networks)的全面开花。2014年NIPS上Goodfellow和Bengio提出了GAN的概念,之后GAN以及其衍生版本在ICLR和NIPS被反复提及,LeCun更是在今年NIPS的keynote上将GAN称为深度学习近20年来最令人兴奋的主题。GAN的设计也非常巧妙,将博弈论和机器学习理论完美结合起来。让generative model和discriminative model互相竞争,力求达到纳什均衡,从而不再需要一个假设的数据分布,并可以极大程度上逼近真实样本。GAN未来在各种视觉类模拟(图像理解、文字转图像、图像合成、图像还原)有着极大的潜力和应用场景,具体可以参考Ian Goodfellow在2016 NIPS上的Slides。”
最后再引用一下丹华资本创始合伙人、斯坦福教授张首晟在活动开始的一段话:
“人工智能现在还只是停留在仿生学的一个阶段,可以做一个类比,人类曾经非常向往飞翔,我们就想自己能不能也长一个翅膀飞。达芬奇曾经设计过一对翅膀来辅助人类飞行,这是一个简单的仿生学。但我们人真正能够飞行是由于我们理解了飞行的原理,那就是空气动力学,一旦我们理解了飞行的原理就可以造大飞机,远远超过于鸟。
现在的人工智能还仅仅停留在用神经元仿生原理的阶段,但是在某个时间节点,或许我们会理解智能的理论基础,这样的话我们就会像理解了飞行空气动力学之后突飞猛进。”
而我们在这个伟大时代的开端。
关注硅谷密探
紧盯全球创新趋势
(长按上方二维码即可关注,神马,这居然是二维码!)