大家好,今天继续和大家分享科技圈最近发生的那些事儿!
一、腾讯被列入军事黑名单
1 月 6 日,美国国防部发布最新版的“涉嫌协助中国军方的企业”清单(根据美国法律正式规定为“第 1260H 条名单”,被认为是直接或间接与中国军方合作的公司)。
腾讯控股和宁德时代两家科技巨头在新增名单首列,被列入这份清单的还包括芯片制造商长鑫存储科技、移远通信、无人机制造商 Autel Robotics 和 IT 设备制造商 Quectel Wireless 、制造基因组测序仪器的华大智造等。
对此,腾讯公司发言人 Danny Marti 表示,被列入黑名单 “显然是一个错误”。“我们不是军工企业或供应商。与制裁或出口管制不同,此次列入名单对我们的业务没有影响。不过,我们将与国防部合作,消除任何误解。”
宁德时代发言人 Fred Zhang 也称将其列入名单是一个 “错误”,该公司强调,“CATL 没有参与任何与军事有关的活动”。“我们欢迎对我们的业务运营进行负责任的讨论,并认真对待有关我们业务的问题"。
二、离谱的搜索秘籍
有网友发现,百度搜索去广告的技巧了。
输入:通下水道。
会得到清一色的广告:
但是加一个 -robin,就没有广告了:
叠个甲:截至 2025.1.7 17:00,是能够复现的。
顺便科普一下「+」、「-」的搜索语法:
语法 | 关键词 + 特定词
语法 | 关键词 - 特定词
效果:搜索结果中会包含加号后的词,不包含减号后的词。
三、LatentSync
字节跳动联合北京交通大学提出了LatentSync,这是一个端到端的唇音同步性框架,它基于音频条件化的潜在扩散模型,无需任何中间运动表示。
我们先看下效果,这是原始视频:
这是替换音频之后的合成效果:
LatentSync 利用 Stable Diffusion 的强大生成能力,直接捕捉复杂的音视频相关性。该模型不需要任何中间 3D 表示或 2D 关键点。
为了提高口型同步精度,作者在解码到像素空间后添加了 SyncNet 监督。为了解决 SyncNet 在高分辨率像素空间和潜在空间中的收敛问题,作者进行了全面的实证研究,识别了影响 SyncNet 收敛的关键因素,如模型架构、训练超参数和数据预处理方法。
由于扩散过程在不同帧之间的一致性较差,作者提出了一种新方法 TREPA,使用大规模自监督视频模型 VideoMAE-v2 提取富含时间信息的时间表示。通过计算生成帧和真实帧之间的时间表示距离作为额外损失,有效提高了时间一致性,同时保持了口型同步精度。
项目地址:
https://github.com/bytedance/LatentSync
https://huggingface.co/spaces/fffiloni/LatentSync