点击下方
卡片
,关注
「3D视觉工坊」
公众号
选择
星标
,干货第一时间送达
本次分享我们邀请到了清华大学计算机系博士
程思婕
为大家着重介绍她的工作。如果您有相关工作需要分享,欢迎文末联系我们。
VidEgoThink: Assessing Egocentric Video Understanding Capabilities for Embodied AI
论文
:
https://arxiv.org/pdf/2410.11623v1
EgoThink: Evaluating First-Person Perspective Thinking Capability of Vision-Language Models
论文
:
https://arxiv.org/pdf/2311.15596
代码
:
https://github.com/AdaCheng/EgoThink
直播信息
时间
2024年
12月25日
(周三)
19:00
主题
CVPR'24 Highlight!面向智能眼镜、人形机器人打造的第一人称视角多模态评测集!
直播平台
3D视觉工坊哔哩哔哩
扫码观看直播,或前往B站搜索3D视觉工坊观看直播
3DCV视频号
也将同步直播
嘉宾介绍
程思婕
清华大学计算机系博士。主要研究方向为基础大模型与具身智能,目前专注于第一人称视角多模态大模型。曾先后在美团/上海人工智能实验室/腾讯等多家知名机构实习,已发表ICLR/NeurIPS/CVPR/ACL/AAAI/ICDE等人工智能顶级会议论文10+篇,并以第一发明人身份授权国家发明专利1项。已获得国家奖学金、中国科协青年人才托举工程博士生专项计划提名、清华大学智能产业研究院院长奖学金、上海市计算机学会优秀硕士学位论文奖、上海优秀毕业生、MFM-EAI@ICML研讨会杰出论文奖等荣誉。
个人主页
:
https://adacheng.github.io/