专栏名称: 计算机视觉工坊

专注于计算机视觉、VSLAM、目标检测、语义分割、自动驾驶、深度学习、AI芯片、产品落地等技术干货及前沿paper分享。这是一个由多个大厂算法研究人员和知名高校博士创立的平台，我们坚持工坊精神，做最有价值的事~

CVPR'24 Highlight！面向智能眼镜、人形机器人打造的第一人称视角多模态评测集！

计算机视觉工坊 · 公众号 · · 2024-12-25 07:00

正文

点击下方卡片，关注 「3D视觉工坊」 公众号
选择星标，干货第一时间送达

本次分享我们邀请到了清华大学计算机系博士 程思婕 为大家着重介绍她的工作。如果您有相关工作需要分享，欢迎文末联系我们。

VidEgoThink: Assessing Egocentric Video Understanding Capabilities for Embodied AI
论文： https://arxiv.org/pdf/2410.11623v1

EgoThink: Evaluating First-Person Perspective Thinking Capability of Vision-Language Models
论文： https://arxiv.org/pdf/2311.15596
代码： https://github.com/AdaCheng/EgoThink

直播信息

时间

2024年 12月25日 (周三) 19：00

主题

CVPR'24 Highlight！面向智能眼镜、人形机器人打造的第一人称视角多模态评测集！

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播，或前往B站搜索3D视觉工坊观看直播

3DCV视频号 也将同步直播

嘉宾介绍

程思婕

清华大学计算机系博士。主要研究方向为基础大模型与具身智能，目前专注于第一人称视角多模态大模型。曾先后在美团/上海人工智能实验室/腾讯等多家知名机构实习，已发表ICLR/NeurIPS/CVPR/ACL/AAAI/ICDE等人工智能顶级会议论文10+篇，并以第一发明人身份授权国家发明专利1项。已获得国家奖学金、中国科协青年人才托举工程博士生专项计划提名、清华大学智能产业研究院院长奖学金、上海市计算机学会优秀硕士学位论文奖、上海优秀毕业生、MFM-EAI@ICML研讨会杰出论文奖等荣誉。
个人主页 ： https://adacheng.github.io/