专栏名称: DataFunSummit
DataFun社区旗下账号,专注于分享大数据、人工智能领域行业峰会信息和嘉宾演讲内容,定期提供资料合集下载。
目录
相关文章推荐
南方人物周刊  ·  旁观者朱德庸|新刊 ·  2 天前  
每日人物  ·  塌房大主播,集体“复活” ·  3 天前  
品牌观察报  ·  董明珠,找到格力接班人了! ·  4 天前  
51好读  ›  专栏  ›  DataFunSummit

如何提高生成视频和文本的语义一致性?

DataFunSummit  · 公众号  ·  · 2024-03-12 12:59

正文

刘孟洋 腾讯TEG 算法工程师

个人介绍:香港城市大学博士学位,腾讯高级算法工程师,5年计算机视觉从业经验,现从事文生视频算法研究工作。研究方向包括视频生成,图像生成,多模态,视频表征学习,大规模视频检索系统等。曾参与构建十亿级视觉检索系统,服务于视频去重,版权保护等。

演讲题目:扩散模型与文生视频

演讲提纲:近年来扩散模型在视觉生成领域大放异彩,跨模态对齐技术让文本控制生成成为可能,文生图以及文生视频领域迎来飞速发展。本次分享将主要介绍文生视频近期的主流方法,以及我们在画质提高、语义一致提升上的一些探索。同时也会介绍一些有趣的应用实践,以及一些可能并不会太长期的展望。

听众收益:

1. 如何用扩散模型实现文本控制生成?

2. 如何提高生成内容和文本的语义一致性?

3. 除了文本还能用什么控制生成呢?







请到「今天看啥」查看全文


推荐文章
南方人物周刊  ·  旁观者朱德庸|新刊
2 天前
每日人物  ·  塌房大主播,集体“复活”
3 天前
品牌观察报  ·  董明珠,找到格力接班人了!
4 天前
肥肥猫的小酒馆  ·  决定人生高度的,不是智力,而是体力
7 年前
扯文艺的蛋  ·  请问您家的房子好看吗?
7 年前