主要观点总结
本文是关于TechBeat人工智能社区举办的线上Talk活动,由香港大学在读博士生李卓凌分享“统一多场景的单目3D目标检测”主题的内容预告。活动将在8月22日北京时间20:00准时开播,介绍了Talk的主题、嘉宾、时间、地点,并提供了相关预习资料和嘉宾介绍等。
关键观点总结
关键观点1: Talk主题
统一多场景的单目3D目标检测,探索单目3D目标检测器的新可能,旨在统一多场景数据集实现检测,并克服网络收敛不稳定问题。
关键观点2: 嘉宾介绍
李卓凌是香港大学在读博士生,此前在华中科技大学取得学士学位、清华大学取得硕士学位,曾在微软、华为、旷视等单位实习,主要研究方向为具身智能、3D视觉感知。
关键观点3: Talk内容
本次Talk将介绍单目3D目标检测的现状和挑战,以及新的检测器UniMODE的设计和实现,包括其在Omni3D benchmark上的性能表现。此外,还将提供论文链接供听众预习。
关键观点4: 社区介绍
TechBeat人工智能社区是一个荟聚全球华人AI精英的学习成长社区,旨在提供AI人才更专业的服务和体验,加速其学习成长。
正文
本期为
TechBeat人工智能社区
第
619
期
线上Talk。
北京时间
8
月22日
(周四)20:00,
香港大学在读博士生
李卓凌
的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是:
“
统一多场景的单目3D目标检测
”
,
届时他将
探索单目3D目标检测器的新可能,
旨在统一多场景数据集实现统一的单目3D目标检测,并且克服联合多数据集训练导致的网络收敛不稳定问题。
主题:统一多场景的单目3D目标检测
长按识别二维码,一键预约TALK!
单目3D目标检测虽已有多年发展,已有检测器却几乎都局限在单一数据集、单一场景中。本工作旨在统一多场景数据集实现统一的单目3D目标检测,并且克服联合多数据集训练导致的网络收敛不稳定问题。
单目3D目标检测已有工作往往局限于在室内或室外场景中,本工作希望能够训练出一个检测器,在室内室外多场景均取得较为精准的检测结果。
首先分析导致难以统一多数据集训练的种种原因,然后设计出了一种新的检测器UniMODE,成功联合多场景数据集进行单目3D目标检测训练并取得稳定的收敛,在Omni3D benchmark上达到SOTA性能。
▼
论文
链接:
https://arxiv.org/2402.18573
论文链接:
https://arxiv.org/2207.10660
Talk·提问交流
▼
在Talk界面下的
【交流区】
参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
李卓凌目前是香港大学在读博士生。此前先后于华中科技大学取得学士学位、清华大学取得硕士学位,曾在微软、华为、旷视等多家单位实习。已发表学术论文近十篇,主要研究方向为具身智能、3D视觉感知。
个人主页:
https://www.techbeat.net/grzytrkj?id=40918