专栏名称: 量子位

վ'ᴗ' ի 追踪AI行业和技术动态，这里更快一步！关注我们，回复“今天”，更多大新闻等你来发现

这项技术可以合成以假乱真的奥巴马视频

量子位 · 公众号 · AI · 2017-07-13 12:10

正文

安妮编译自 IEEE Spectrum
量子位出品 | 公众号 QbitAI

△ 奥巴马镇楼

可能奥巴马也要分辨不出自己视频的真假了，这也不能怪他。

一种新算法可以用现有的音频与视频素材，合成高逼真的假视频。也就是说，我们可以将一段音频加到任意视频片段中，看起来会像视频里的人真的在说这段话。

奥巴马的假视频就是这样被合成的，看起来还比较流畅——

△ 视频请去百度云观看，地址：
https://pan.baidu.com/s/1eSGf96q

这项技术由华盛顿大学SUPASORN SUWAJANAKORN等三人共同发明，他们坦言，之所以选用奥巴马做研究范例，是因为他的高清视频资源获取非常容易，并且不受版权限制。

因此，研究小组用神经网络分析了数百万帧的视频，来确定奥巴马的面部表情如何变化。开口说话需要整个面部器官的协调，所以研究人员不仅分析了口型变化，还包括他的嘴唇、牙齿和下巴周围的皱纹，甚至还包括脖子与衣领。

该技术研发人员之一IRA指出，这项技术可以用于改善视频会议的质量——电话会议中的视频输出可能会有口吃、卡顿或分辨率低等现象，但音频传输通常非常流利。

因此在将来，视频会议可能会变成传话人传输音频，并使用该软件重建人物谈话时的面部表情。

研究人员也指出，目前的合成视频并不完美（也会穿帮）。当视频中的奥巴马将抬头向上看时，可能嘴巴会出现在脸部之外。

因为这个算法不会模仿情绪，所以有时输出的奥巴马视频看起来会不合时宜地非常严肃，或者对于严肃的演讲来说，显得太开心了。

△ 两组原视频与合成视频对比图

心疼奥巴马。

最后，附奥巴马表情包论文地址：

http://grail.cs.washington.edu/projects/AudioToObama/siggraph17_obama.pdf

【完】

交流沟通

量子位读者5群开放申请，对人工智能感兴趣的朋友，可以添加量子位小助手的微信qbitbot2，申请入群，一起研讨人工智能。

想要更深一步的交流？

量子位还有大咖云集的自动驾驶技术群，仅接纳研究自动驾驶相关领域的在校学生或一线工程师。申请方式：添加qbitbot2为好友，备注“自动驾驶”申请加入~

如果你从事NLP方向的研究，欢迎加入量子位的NLP群。申请方式：添加qbitbot2为好友，备注“NLP”申请加入~

（自动驾驶、NLP等群的审核条件比较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者等岗位（以及实习生），工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在公众号对话界面，回复：“招聘”两个字。

△ 扫码强行关注『量子位』

追踪人工智能领域最劲内容

推荐文章

浩歌行 · 阿里的“深夜炸弹”：Qwen2.5-Max超越DeepSeek V3？

昨天

浩歌行 · 阿里的“深夜炸弹”：Qwen2.5-Max超越DeepSeek V3？

昨天

宝玉xp · 转发微博-20250129032706

2 天前

机器之心 · 2025年，当我们在谈论Agent的时候在讨论的到底是什么？

2 天前

爱可可-爱生活 · 【[5星]gla-jax：用JAX和pallas实现Gated -20250127181258

3 天前

人工智能那点事 · 雷军直播时突然被封！疑因这个原因被举报

4 天前

冲蒌老伍 · 真系激到爆血管，顶你个肺

8 年前

新街派生活报 · 20万元被转走！因办卡时他做了一件事，银行被判全赔！

7 年前

悦读文摘 · 25岁后 | 肌体开始衰老的5个信号，3步保养恢复年轻

7 年前

故事贩卖机 · 中二病什么的，最可爱了啦！

7 年前

中国生物产业信息平台 · 推动中药产业化跨越式发展制药机械企业肩负重任

7 年前

这项技术可以合成以假乱真的奥巴马视频

正文

安妮 编译自 IEEE Spectrum量子位出品 | 公众号 QbitAI

△ 两组原视频与合成视频对比图

交流沟通

诚挚招聘

安妮编译自 IEEE Spectrum
量子位出品 | 公众号 QbitAI