专栏名称: 计算机视觉工坊
专注于计算机视觉、VSLAM、目标检测、语义分割、自动驾驶、深度学习、AI芯片、产品落地等技术干货及前沿paper分享。这是一个由多个大厂算法研究人员和知名高校博士创立的平台,我们坚持工坊精神,做最有价值的事~
目录
相关文章推荐
今日悉尼  ·  澳洲洪水肆虐,香蕉价格恐涨至$14澳元/kg ... ·  22 小时前  
51好读  ›  专栏  ›  计算机视觉工坊

CVPR'24 Highlight!面向智能眼镜、人形机器人打造的第一人称视角多模态评测集!

计算机视觉工坊  · 公众号  ·  · 2024-12-25 07:00

正文

点击下方 卡片 ,关注 「3D视觉工坊」 公众号
选择 星标 ,干货第一时间送达

本次分享我们邀请到了清华大学计算机系博士 程思婕 为大家着重介绍她的工作。如果您有相关工作需要分享,欢迎文末联系我们。

VidEgoThink: Assessing Egocentric Video Understanding Capabilities for Embodied AI
论文 https://arxiv.org/pdf/2410.11623v1

EgoThink: Evaluating First-Person Perspective Thinking Capability of Vision-Language Models
论文 https://arxiv.org/pdf/2311.15596
代码 https://github.com/AdaCheng/EgoThink

直播信息

时间

2024年 12月25日 (周三) 19:00

主题

CVPR'24 Highlight!面向智能眼镜、人形机器人打造的第一人称视角多模态评测集!

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播,或前往B站搜索3D视觉工坊观看直播

3DCV视频号 也将同步直播

嘉宾介绍

程思婕

清华大学计算机系博士。主要研究方向为基础大模型与具身智能,目前专注于第一人称视角多模态大模型。曾先后在美团/上海人工智能实验室/腾讯等多家知名机构实习,已发表ICLR/NeurIPS/CVPR/ACL/AAAI/ICDE等人工智能顶级会议论文10+篇,并以第一发明人身份授权国家发明专利1项。已获得国家奖学金、中国科协青年人才托举工程博士生专项计划提名、清华大学智能产业研究院院长奖学金、上海市计算机学会优秀硕士学位论文奖、上海优秀毕业生、MFM-EAI@ICML研讨会杰出论文奖等荣誉。
个人主页 https://adacheng.github.io/







请到「今天看啥」查看全文