专栏名称: 计算机视觉工坊
专注于计算机视觉、VSLAM、目标检测、语义分割、自动驾驶、深度学习、AI芯片、产品落地等技术干货及前沿paper分享。这是一个由多个大厂算法研究人员和知名高校博士创立的平台,我们坚持工坊精神,做最有价值的事~
目录
相关文章推荐
51好读  ›  专栏  ›  计算机视觉工坊

港大开源 | 全面理解3D场景!

计算机视觉工坊  · 公众号  ·  · 2025-01-15 07:00

正文

点击下方 卡片 ,关注 「3D视觉工坊」 公众号
选择 星标 ,干货第一时间送达

本次分享我们邀请到了香港大学二年级博士生 戚张扬 ,为大家着重介绍他的工作。如果您有相关工作需要分享,欢迎文末联系我们。

GPT4Scene: Understand 3D Scenes from Videos with Vision-Language Models
主页 https://gpt4scene.github.io/
论文 https://arxiv.org/pdf/2501.01428
代码 https://github.com/Qi-Zhangyang/gpt4scene

直播信息

时间

2025年 1月15日 (周三) 19:00

主题

GPT4Scene:用Vision Language Models去理解3D场景

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播,或前往B站搜索3D视觉工坊观看直播

3DCV视频号 也将同步直播

嘉宾介绍

戚张扬

香港大学二年级博士生,香港政府博士奖学金获得者。主要研究方向为3D点云多模态以及3D AIGC。主要论文有GPT4Point(CVPR 2024 Highlight), Pointcept(通用点云感知框架)。







请到「今天看啥」查看全文