专栏名称: 我们的设计日记
定期分享设计周刊,设计趋势,设计方法
目录
相关文章推荐
上下五千年故事  ·  口腔的清道夫,牙齿的保护神——中药牙粉,改善 ... ·  22 小时前  
每日英语  ·  中国文化 | 打树花(Dashuhua) ·  昨天  
51好读  ›  专栏  ›  我们的设计日记

微软又在搞事情?让蒙娜丽莎唱饶舌,太炸裂了!

我们的设计日记  · 公众号  ·  · 2024-04-23 12:23

正文

你见过蒙娜丽莎唱饶舌么? SD又更新了新的版本?一起了解下最新的AI工具和AI资讯吧! 想学习更多AI相关知识,获取更多AI信息内容,欢迎 AI绘画师日记星球 学习交流。

01.

微软 VASA-1:可生成会说话的,动态人物视频

微软亚洲研究院推出了VASA-1,用户只需要输入一张图片和一段音频,就能生成表情丰富、细节逼真的动态人物视频。

这么会饶舌的蒙娜丽莎你见过么?太魔性了!

传统的人物合成视频,通常会将嘴唇运动、面部表情、眼睛凝视和眨眼等面部动态分开处理,这样做虽然可以精准捕获面部细节,但在合成阶段会出现不协调、抽搐、算力成本高等缺点。

而VASA-1对面部动态和头部运动进行了综合建模,将所有这些面部动态视为一个单一的潜在变量,并通过视频数据训练了一个表达丰富且解耦的面部潜在空间,能够以更低的资源消耗捕捉到人类面部的细微表情和头部动作,从而生成逼真、表情丰富的动态人物视频。


02.

斯坦福关于人工智能报告

该报告讲了人工智能对行业的影响,像成本上升、投资变化,以及监管和道德方面的问题。


03.

Atlas:波士顿动力发布的全新人形机器人

波士顿动力宣布停止开发其液压动力机器人Atlas。

新的电动Atlas机器人在设计上与以往版本截然不同,拥有更轻巧的机械骨架和更平滑的动作。

如180度头部旋转和快速的站立行动...

这款机器人的动作灵活,可以执行复杂的任务,如从地面自行站立等特别是在复杂和狭窄的空间中,提高了机器人在实际工作环境中的适用性。


04.

SD重大更新:SDXL版本的tile更新了

XL版本的tile模型的更新,算得上是里程碑事件,magnific.ai最大的竞争对手要来了!


05.

udio:首个人工音频生成大模型

音频大模型,是指能生成各种音效、语音内容的大模型。

相比suno只能生成音乐,udio的能力更强。

人工智能+AI音频,造就了AI音频大模型。



06.

Captions :Ai视频剪辑工具


它可以自动识别超长视频的有价值判断并且自动剪辑成多条适合传播的短视频。

生成的短视频可以选择对应的字幕模板,并且支持AI自动在对应的视频片段添加音效、贴纸等增加氛围的内容。

此外还支持AI眼神注视、AI 降噪、AI 唇形同步、AI 调色等一系列自动化的 AI 能力。最重要的还是网页版本的,任何平台都能用。


07.

LoopGaussian:可将静止场景多视图图像转换为真实的3D动态图像







请到「今天看啥」查看全文