专栏名称: 计算机视觉工坊
专注于计算机视觉、VSLAM、目标检测、语义分割、自动驾驶、深度学习、AI芯片、产品落地等技术干货及前沿paper分享。这是一个由多个大厂算法研究人员和知名高校博士创立的平台,我们坚持工坊精神,做最有价值的事~
目录
相关文章推荐
环保人  ·  备用锅炉算进合计出力不?有明确依据? ·  3 天前  
青海生态环境  ·  一图读懂丨《企业温室气体排放核查技术指南 ... ·  3 天前  
青海生态环境  ·  一图读懂丨《企业温室气体排放核查技术指南 ... ·  3 天前  
51好读  ›  专栏  ›  计算机视觉工坊

洞悉跨模态信息流:揭秘多模态大语言模型的内在工作机制

计算机视觉工坊  · 公众号  ·  · 2024-12-24 07:00

正文

点击下方 卡片 ,关注 「3D视觉工坊」 公众号
选择 星标 ,干货第一时间送达

本次分享我们邀请到了荷兰阿姆斯特丹大学在读博士 张智 为大家着重介绍他的工作。如果您有相关工作需要分享,欢迎文末联系我们。

Cross-modal Information Flow in Multimodal Large Language Models
论文 https://arxiv.org/pdf/2411.18620

直播信息

时间

2024年 12月24日 (周二) 19:00

主题

洞悉跨模态信息流:揭秘多模态大语言模型的内在工作机制

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播,或前往B站搜索3D视觉工坊观看直播

3DCV视频号 也将同步直播

嘉宾介绍

张智

荷兰阿姆斯特丹大学, Institute for Logic, Language and Computation 学院, Amsterdam Natural Language Understanding Lab 实验室, 在读博士。主要研究方向包括多模态学习,多模态大模型,以及大模型的efficiency等。

直播大纲







请到「今天看啥」查看全文