▲
Momenta公司创始人曹旭东
“我相信未来世界的生产力和自由,将来自大数据和智能。而深度学习的无人驾驶技术本身是一个较为年轻的领域,更新换代的速度非常快,对自己技术的实践应用是一个机会,这也是我选择无人驾驶方向的原因,”
Momenta
创始人曹旭东说道。
Momenta是一家刚成立不久的专注做无人车大脑的公司,
核心技术
是基于深度学习的环境感知,高精地图,驾驶决策算法。产品包括不同级别的自动驾驶方案,以及衍生出的大数据服务。
放弃学业、放弃高薪,一心只为AI
Momenta公司的CEO曹旭东
2008
年毕业于清华大学,本科专业是工程力学,但对统计学有着浓厚的兴趣。本科毕业后,他顺利成为清华大学的直博生。在博一期间,他对
人工智能
尤为感兴趣,“当时我一心扎入人工智能计算机相关的课程,哪怕自己上课、看书、查文献都乐在其中,”曹旭东回忆说。
对于AI,曹旭东可以用痴迷来形容,博一过后为AI出国深造申请了退学,即使在导师三次挽留的情况下也没能改变他的主意。
离开清华后,曹旭东来到
微软亚洲研究院
,因微软的技术和学术氛围留在了这里,如愿做了AI相关的研究,他所研发的
视觉识别技术
被用在了
Xbox
,
Bing
,
How-old
等知名产品。
2014
年底,深度学习还似炼丹术,其中的原理无法讲清楚,而在理论研究上,曹旭东已经有了自己的一套研究方法并发表了很多学术文章,但终不能令他满意,他认为理论需要解决实际问题 。
所以,为让自己的研究成果能在实践中得到验证,曹旭东曾参加了
National Data Science Bowl
比赛,与
1000
多支来自世界各地团队的选手角逐,并拿到全球
第二
的好成绩。
2015
年,曹旭东将创业目标锁定在了
无人驾驶领域
,之后基于对“个人和环境的交互能激发智能”的执着追求,曹旭东开始了无人驾驶的技术路径和商业路径的探索,并创办Momenta,专注做
无人车的大脑
。
如何解决无人驾驶最重要的安全问题?
据统计,从全球人类司机在一亿公里发生
致命事故
一至三起,而无人驾驶需要做到更安全,安全意味着低事故率。一个系统要做到低事故率,通常要做到:
一是发现问题,二是解决问题。
而解决这些问题则需要无人车进行大规模数据
收集
和
测试
,
一方面需要海量的测试车辆,另一方面是高昂的单车成本
。
Momenta的做法
是用
无人驾驶模拟
、
众包数据收集
和
测试
两种互补的解决方案降低无人驾驶的低事故率。
具体来讲,无人驾驶模拟可以通过算法生成感知和决策数据,减少数据收集和测试车辆数量,降低研发成本。
但曹旭东坦言,无人驾驶模拟也存在
不足
。
第一
,模拟生成的感知数据和真实的数据存在差异,实际中,还是以真实数据为主,生成数据为辅。
第二
,模拟的规则是人制定的。很多失败的场景恰恰是人思考的盲点,单纯通过模拟并不能发现。
另外,曹旭东告诉邦哥,“虽然模拟可以降低数据收集和测试车辆的数量,但是我们仍然需要收集真实数据,用大量的车做真实测试。”
而在单车成本方面,其主要由
三部分
构成:
设备成本
,
造车成本
,
运营成本
。后两者已经优化了上百年,很难降低。设备成本方面,Momenta发挥
算法优势
,通过
多摄像头
等廉价设备实现无人驾驶。
“摄像头是所有感知设备中信息量最大的,需要
人脑水平
的强人工智能,才能从间接视频数据中提取出无人驾驶所需要的直接数据,”曹旭东称。
降低造车成本和运营成本目前最好的
办法
是通过
众包模式
让其他人承担这部分成本,这种模式其实代表性的公司已经有
特斯拉
这些大佬在尝试,但遗憾的是他们需要
造车
、
读取
和
控制车辆
行为,这需要很大的时间成本,显著慢于算法的研究节奏。
“
我们的想法
是直接利用已有的运营车辆,避开造车、改车、控制车等过程,通过众包,就可以获得海量环境和行为数据,并构建高精度地图,再通过数据驱动的方式学习无人驾驶决策,”曹旭东这样告诉邦哥。
高精度地图方面,Momenta通过多张图像存在的视差,利用点的对应关系,将图像中的2D点恢复到真实世界中的3D点。从基本原理出发,建立高精地图,Momenta用不一样的方式尝试解决
三个难题
。
✦图像部分:检测识别语义点。
不同于
传统的SLAM或者SFM算法所用的SIFT、ORB等人工设计的特征点,Momenta的
方法
是定义道路标线、标牌等地标上的点作为语义点,通过
深度学习
和
数据驱动
的监督训练得到模型,可以准确检测和识别语义点,解决检测不到、匹配错误的问题。
✦几何部分:通过众包间接实现海量摄像头测量效果。
不同车辆,不同时间,经过同一地标,即使光照视角不同,通过语义点模型把所有车辆拍摄到的同一语义点关联起来,这相当于间接实现了多摄像头测量的效果。
众所周知,视觉测量中,摄像头越多、视差覆盖越全,测量精度就越高。Momenta的
实验验证
,随着众包车次的增加,真实3D点位置估计的准确性有量级上的提升。
✦GPS部分:给每个语义点精确的GPS坐标。
Momenta的考量是:
(1)让高精地图通用。GPS坐标是地图的通用语言,给每个语义点赋予GPS坐标,便于他人使用。
(2)消除累积误差。单纯使用几何方法构建局部地图,会有累积误差,结合GPS,可以解决这个问题。
(3)消除局部地图歧义性。当局部地图有重合或者语义点缺失的时候,确定局部地图坐标系很麻烦,但全局GPS坐标系没有这个问题。
任重而道远
无人驾驶技术是一个非常庞大的知识体系,
定位
、
感知
、
决策
、
控制
是其亟待解决的四大问题,在这四个方向上都有很多子问题。对于初期的Momenta而言,团队来源于清华大学、麻省理工学院、微软亚洲研究院等,有深厚的技术积累和很强的技术原创力,这将是其布局驾驶的技术和团队优势。
但邦哥认为,目前Momenta如何紧跟时代潮流,尽快将不同级别的无人驾驶技术落地,以及对行业大数据的快速积累将是当务之急。而在
瞬息万变
的AI领域,面对竞争对手和行业巨头们,Momenta接下来的路任重而道远。
目前,刚成立不久的Momenta获得
A轮500万美元
投资,本轮由
蓝湖资本
领投,
创新工场
和
真格基金
跟投。
团队成员:
▲
Momenta团队成员
曹旭东,Momenta公司CEO,毕业于清华大学。创立Momenta之前,先后任职于微软亚洲研究院和商汤科技,有近百人研发团队管理经验以及丰富的产品落地经验。研发技术用于Xbox,Bing,How-old等知名产品。对无人驾驶环境感知,高精地图,驾驶决策有深入研究。
任少卿,Momenta公司研发总监,毕业于中国科技大学与微软亚洲研究院联合培养博士班,提出适用于物体检测的高效框架
Faster RCNN
和图像识别算法
ResNet
,后者相关论文于
2016
年获得计算机视觉领域顶级会议CVPR 的
Best Paper Award
。这两项成果帮助微软在
2015 ImageNet
,
2015 MS COCO Challenge
等比赛中获得
多项冠军
,比赛的参与者包括来自
Google Brain
,
Facebook AI Research
等著名AI实验室的若干队伍。
双11系列报道:
-
END -
邦哥的好朋友毒舌科技
l
ID:dushekeji
长 按
二 维 码 , 一 键 关 注
更多精彩文章:
商务合作请加微信:bangcbd