专栏名称: 深度学习自然语言处理
一个从大三就接触NLP的小小NLPer,本公众号每天记录自己的一点一滴,每篇文章最后也有托福单词等新知识,学技术同时,也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇!
目录
相关文章推荐
Java编程精选  ·  国产 DeepSeek V3 ... ·  昨天  
Java编程精选  ·  手把手教你Java文件断点下载 ·  19 小时前  
Java编程精选  ·  为什么不建议用 equals 判断对象相等? ·  3 天前  
芋道源码  ·  裁员天花板:全员降薪40%,“闲置员工” ... ·  2 天前  
51好读  ›  专栏  ›  深度学习自然语言处理

今晚8:30,荣幸邀请到电影导演和LLM科学家一起聊聊对多模态的见解

深度学习自然语言处理  · 公众号  ·  · 2024-12-16 11:17

正文

主题

创意 v.s. 智能|电影导演与AI科学家视角下的长视频理解主题圆桌会

前言

随着AI技术的迅猛发展,电影创作与视频理解的边界正日益模糊。 NICE组织将于12月16日晚20:30举办首次圆桌会系列活动。

本次圆桌会将邀请电影导演与计算机视觉科学家展开跨界对话,探讨AI如何在电影叙事与实时直播流的长视频理解中发挥关键作用。电影导演将分享艺术创作的思考,AI科学家则从技术角度探讨电影视频的深层理解、音频描述生成及直播流数据的实时解析。

通过这一跨领域的碰撞与交流,我们希望激发对AI如何推动不同视频领域创新的深刻思考,展望未来创作与观影体验的无限可能。

本次圆桌会还设有开放讨论环节,邀请与会者共同参与,从多个维度探讨电影艺术、视频理解和直播流的相互影响,激发更多创新思维和实践启示。

嘉宾介绍

韩腾达,谷歌DeepMind研究科学家 。于牛津大学Visual Geometry Group(VGG)组获得博士学位,师从Andrew Zisserman教授,致力于自我监督学习和视频理解。个人主页:https://tengdahan.github.io/。本次圆桌会将会分享关于电影音频描述(Movie audio description)生成相关工作。

林浩天,剑桥大学电影与荧幕研究硕士,上海交通大学影视系艺术学学士,纪录片导演,摄影师 。主要从事电影技术、电影史研究,作品于国际电影节、摄影大赛获各类奖项,曾参与麻省理工学院人工智能电影黑客松活动评审及组织工作。个人主页www.haotianlin.com。

狄尚哲,上海交通大学二年级博士生 ,主要研究方向是视频理解和多模态学习。本次分享将围绕本人在长视频问答方向的研究展开。长视频中丰富的视觉信息虽然带来了新的机遇,但也显著增加了视频问答模型的训练难度。此外,仅输出答案往往缺乏合理性解释,限制了模型的可解释性和实际应用。为解决这些问题,我们开展了一系列研究,包括:在长视频问答时给出与问题相关的一个或多个视频片段;以及面向长视频流的上下文键值缓存检索方法。个人主页:https://dszdsz.cn/。

主持人







请到「今天看啥」查看全文