如何提高生成视频和文本的语义一致性？

DataFunSummit · 公众号 · · 2024-03-12 12:59

正文

刘孟洋腾讯TEG 算法工程师

个人介绍：香港城市大学博士学位，腾讯高级算法工程师，5年计算机视觉从业经验，现从事文生视频算法研究工作。研究方向包括视频生成，图像生成，多模态，视频表征学习，大规模视频检索系统等。曾参与构建十亿级视觉检索系统，服务于视频去重，版权保护等。

演讲题目：扩散模型与文生视频

演讲提纲：近年来扩散模型在视觉生成领域大放异彩，跨模态对齐技术让文本控制生成成为可能，文生图以及文生视频领域迎来飞速发展。本次分享将主要介绍文生视频近期的主流方法，以及我们在画质提高、语义一致提升上的一些探索。同时也会介绍一些有趣的应用实践，以及一些可能并不会太长期的展望。

听众收益：

1. 如何用扩散模型实现文本控制生成？

2. 如何提高生成内容和文本的语义一致性？

3. 除了文本还能用什么控制生成呢？

昨天

南方人物周刊 · 《再见爱人》后，他人红了、流量多了，但工作没了

昨天

南方人物周刊 · 旁观者朱德庸｜新刊

2 天前

每日人物 · 塌房大主播，集体“复活”

3 天前

品牌观察报 · 董明珠，找到格力接班人了！

4 天前

匈牙利新导报 · 【意大利一载有匈牙利青少年巴士发生车祸】致16人死亡

8 年前

潮音乐 · 叔推 | 王菲《人间》，但愿你的眼睛只看得到笑容

7 年前

澄泓财经 · 收评：资源股调整到位，增仓坐等反弹！

7 年前

肥肥猫的小酒馆 · 决定人生高度的，不是智力，而是体力

7 年前

扯文艺的蛋 · 请问您家的房子好看吗？

7 年前