提出Draw an Audio框架,通过引入绘制的蒙版和响度信号作为额外输入指令,实现了生成与视频内容、时间和响度一致的可控音频。
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师 |
爱可可-爱生活 · 自对数演化解码 (SLED) ... · 2 天前 |
爱可可-爱生活 · [LG]《ADOPT: Modified ... · 2 天前 |
爱可可-爱生活 · 《爱可可微博热门分享(11.4)》 ... · 5 天前 |
新智元 · UCLA、MIT数学家推翻39年经典数学猜想 ... · 5 天前 |
宝玉xp · 其实中文也可以,重点是逻辑清晰,表达清楚,善 ... · 5 天前 |
爱可可-爱生活 · 自对数演化解码 (SLED) 是一种新的解码框架,通过巧妙地利用-20241107051037 2 天前 |
爱可可-爱生活 · [LG]《ADOPT: Modified Adam Can Co-20241107054723 2 天前 |
爱可可-爱生活 · 《爱可可微博热门分享(11.4)》 爱可可微博热门分享(11.-20241104223514 5 天前 |
新智元 · UCLA、MIT数学家推翻39年经典数学猜想!AI证明卡在99.99%,人类最终证伪 5 天前 |
宝玉xp · 其实中文也可以,重点是逻辑清晰,表达清楚,善于将问题分解//@高-20241104090407 5 天前 |
中国经济网 · 心是一块田,快乐自己种!丨可读 7 年前 |
丁香医生 · 烂嘴角就是「上火」吗?答案可没那么简单 7 年前 |
三文娱 · 《变形金刚》票房过8亿:它如何从一款玩具成为一个大热IP? 7 年前 |
财新网 · 《赤龙》连载 第三章《天竺香》:杨继宗顺藤寻线索,柳先生指引养荣堂 7 年前 |
静塾文化 · 这些教育方法不适合用在男孩身上 7 年前 |