【导读】当地时间 10月 22 日到10月29日,两年一度的计算机视觉国际顶级会议 International Conference on Computer Vision(ICCV 2017)正在意大利威尼斯开幕,来自世界各地的计算机视觉专家聚集在威尼斯介绍计算机视觉和相关领域的最新进展。Facebook 人工智能实验室研究科学家何恺明包揽最佳论文奖(Marr Prize)和最佳学生论文奖。其中最佳论文为 Mask R-CNN,何恺明和他的同事举办了ICCV 2017 Tutorial on Instance-level Visual Recognition。他介绍了 Mask R-CNN。
【ICCV2017视觉盛宴概况】何恺明博士包揽最佳论文和最佳学生论文奖!Facebook成大赢家!
Instance-level Visual Recognition Tutorial
介绍:
本教程的目的是讨论在事例级识别的最新进展。我们将详细讨论关于目标检测上的最新工作,从一个单一的图像进行示例分割和人体姿态预测,我们也将报道在视频物体理解上的最新进展。最后,我们将介绍如何使用基于示例层次的识别任务比如人和物体的交互,视觉关系和示例层次推理。
日程:
14:00 - 14:10 . Welcome and Overview. slides
https://www.dropbox.com/s/zuns2t1xv51o056/iccv2017intro.pdf?dl=0
14:10 - 14:50 . Talk 1: The Generalized R-CNN Framework for Object Detectionby Ross Girshick slides
https://www.dropbox.com/s/ae0xv15qb4gb9lq/ICCV2017_InstanceTutorial_GeneralizedRCNN_Ross_Girshick.pdf?dl=0
14:50 - 15:20 . Talk 2: Mask R-CNN: A Perspective on Equivariance by Kaiming He slides
15:20 - 15:50 . Talk 3: Recognizing Human-Object Interactions by Georgia Gkioxari slides
https://www.dropbox.com/s/unqhvq0z9h4wfqv/iccv2017tutorial_georgia.pdf?dl=0
15:50 - 16:30 . Break.
16:30 - 17:00 . Talk 4: Flow-based Video Recognition by Jifeng Dai slides
https://www.dropbox.com/s/a8zioeov4988imb/Jifeng_FlowBasedVideoRecognition.pdf?dl=0
17:00 - 17:30 . Talk 5: Beyond Object Instances by Justin Johnson slides
https://www.dropbox.com/s/ip4pohnevjojuwu/Justin_Slides.pdf?dl=0
17:30 - 17:45 . Closing Remarks
注:以上均包含报告的下载链接,但dropbox需在墙外,我们已经下载好全部报告,请关注我们公众号,回复下载,文末查看。
Mask R-CNN: A Perspective on Equivariance
· 论文:《Mask R-CNN》
作者:Kaiming He, Georgia Gkioxari, Piotr Dollár, Ross Girshick
论文地址:https://research.fb.com/publications/mask-r-cnn/
Arxiv:https://arxiv.org/abs/1703.06870
这篇论文提出了一个小巧、灵活的通用对象实例分割框架(object instance segmentation)。Mask R-CNN不仅可对图像中的目标进行检测,还可以对每一个目标给出一个高质量的分割结果。其在Faster R-CNN基础之上进行扩展,并行地在bounding box recognition分支上添加一个用于预测目标掩模(objectmask)的新分支。该网络还很容易扩展到其他任务中,比如估计人的姿势,也就是关键点识别(person keypoint detection)。该框架在COCO的一些列挑战任务重都取得了最好的结果,包括实例分割(instance segmentation)、候选框目标检测(bounding-box object detection)和人关键点检测(personkeypoint detection)。
以下为slides内容:
转自:专知
完整内容请点击“阅读原文”