城市大脑三项技术研究论文同时入选多媒体领域的顶级学术会议——第25届国际多媒体会议ACM Multimedia(简称ACM MM),论文作者将于今年10月赴美作大会报告。
ACM MM是全世界多媒体领域的顶级会议,属中国计算机学会(CCF)指定的A类国际会议。据ACM MM2017评委会介绍,今年会议共收到675篇论文,经审慎的多重评选,三篇来自城市大脑研究团队的论文被大会录用。
这三篇论文都由城市大脑项目组核心团队——阿里巴巴iDST(Institute of Data Science and Technologies)成员研究得出,分别针对城市大脑所涉及的交通事故、人流轨迹、交通数据样本等问题提出解决办法。
据悉,受邀赴美作口头报告的论文占比仅为7.5%,ACM MM在通知邮件中称整个论文评选过程为“艰难激烈的”。
口述报告:
Spatio-Temporal Auto Encoder for Video Anomaly Detection
时空自编码器的视频异常检测模型
为城市大脑提供监控交通异常的方法。受动作识别等领域的最新研究成果启发,设计了一种时空自编码进行视频异常检测,同时提出一种权重递减的预测误差计算方法。经真实的交通场景评测,该算法在重要指标上已经超过了此前的最好方法。
Deep Siamese Network with Multi-level Similarity Perception for Person Re-identification
基于多层相似度感知的深度神经网络及其在同人鉴别中的应用
为人流轨迹的识别判断提供技术支持。结合深度学习的Siamese网络和分类网络模型优势,同时将相似度扩展到其他层次。与经典的大规模同人鉴别公开数据集对比,目前检索精确度的最优结果已达业内最高水平。
海报报告:
Stylized Adversarial Autoencoder for Image Generation
基于风格化对抗自编码器的图像生成算法
解决城市大脑交通视频数据样本不足的问题。受条件对抗生成网络和风格迁移学习的启发,采用内容提取网络和风格提取网络分别从内容图片和风格图片中提取特征,将两者融合后,通过图片生成网络获得融合相应内容和风格的图片。