专栏名称: 深度学习自然语言处理
一个从大三就接触NLP的小小NLPer,本公众号每天记录自己的一点一滴,每篇文章最后也有托福单词等新知识,学技术同时,也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇!
目录
相关文章推荐
万安夏港  ·  【重要通知】公开招募! ·  15 小时前  
万安夏港  ·  【重要通知】公开招募! ·  15 小时前  
中国能建  ·  中国能建China ... ·  2 天前  
读特新闻  ·  时隔3年,周杰伦要发新专辑了 ·  2 天前  
读特新闻  ·  时隔3年,周杰伦要发新专辑了 ·  2 天前  
中国能建  ·  “能源+”的美妙一天,太酷啦! ·  3 天前  
51好读  ›  专栏  ›  深度学习自然语言处理

MatchTime | 当LLM开始做足球解说:关于多模态模型在体育领域的应用 -- NICE29期

深度学习自然语言处理  · 公众号  ·  · 2024-09-23 21:09

正文

主题

当LLM开始做足球解说:关于多模态模型在体育领域的应用


时间

2024.9.28 20:00-21:00 周六

入群


论文 :MatchTime: Towards Automatic Soccer Game Commentary Generation (EMNLP 2024)
地址 :https://arxiv.org/pdf/2406.18530

所有代码、数据集均已开源

代码链接: https://github.com/jyrao/MatchTime/

项目网页: https://haoningwu3639.github.io/MatchTime/

数据集: https://huggingface.co/datasets/Homie0609/MatchTime/

演示视频: https://www.bilibili.com/video/BV1L4421U76m

大纲

  1. 关于多模态视频理解(简要介绍视频方面的跨模态应用)
  2. 体育领域的人工智能(数据集、分类任务、足球理解)
  3. 论文分享:"MatchTime: Towards Automatic Soccer Game Commentary Generation"
  4. 当前工作与未来规划(足球项目进展、通用模型概想)

引言

本文围绕MatchTime英文的两种释义解决目前足球领域视频理解的两方面问题,从而实现更好的足球解说:
- 对齐时间戳
大量视频与文本的精确对应是多模态模型学习理解视频的基础。然而,观察到现有足球解说数据集中普遍存在视频文本时序不对齐问题,远无法达到训练所需的精准水平。此研究首先对部分比赛的解说时间戳进行手动标注,构建了一个精准的的足球比赛解说生成基准测试集SN-Caption-test-align。并在此基础上,提出了一个多模态时序对齐流水线,实现对现有数据集自动校正和过滤,生成高质量的足球解说数据集 MatchTime。
- 比赛期间解说






请到「今天看啥」查看全文