专栏名称: 网罗灯下黑
聊点网络生活中不为人知的有趣事
目录
相关文章推荐
51好读  ›  专栏  ›  网罗灯下黑

这个今天刚上线的神器被大家玩疯了!

网罗灯下黑  · 公众号  ·  · 2024-07-26 20:06

正文

请到「今天看啥」查看全文


自从 Sora 画了个大饼之后,似乎就再没听到什么新动静,就像 那个在朋友圈晒了张健身卡照片后,就再也没见他去过健身房的哥们。

可别人都没闲着,继快手可灵前阵子发布之后,就在今天,智谱 AI 突然来了个大招——发布了文生视频大模型 CogVideoX 以及基于这一模型推出了 AI 视频应用 清影, 这消息就像突然在朋友圈冒出的健身成果照,让人眼前一亮。

Sora 的套路,就像是那个只会说“下次请你吃饭”但从没兑现的朋友,而智谱这次可是来真的, 上线就是全量开放,所有用户都能用, 同时支持网页版和手机端,只要你把智谱清言更新到最新版本,人人开箱即可使用。

你所需要做的,就只是提供一个画面描述,最快 30 秒,就能得到一个 6 秒的视频,这操作,简直就是请全城的人吃饭,你说谁受得了?

立马翻身下床来玩一波,看看到底是个什么水平。

玩法主要分两种,一种是就是图生视频,在图片基础上生成连贯的画面。

还有一种文生视频,这个玩法就是纯念咒语,玩过 AI 绘图的都知道。

图生视频

先说图生视频吧,这个功能最开始网友们就用来修复老照片,用 AI 技术把静止的瞬间变得生动起来。

这个功能估计很多人都会感兴趣,毕竟这类视频在短视频平台上出了太多爆款,本来只是亲人的一张静止的老照片,可照片上的人突然冲你微微一笑,这回忆更加动感真切。

对了,这个让老照片动起来的功能还有微信小程序版,只要你有手机, 就能 0 门槛体验这个玩法

在微信里面搜索小程序:智谱清言,或者直接点右边的链接 智谱清言 上传老照片就能直接生成视频。

来看看这些效果吧:

提示词:图中男子站起来,风吹起他的头发

原本静止的人,突然就缓缓站了起来,头发被吹起来的细节也很精致。

提示词:图中的老奶奶戴起了耳机

奶奶戴耳机后还添加了摇头晃脑的动作,莫名有一种喜感。

提示词:老人掏出一个苹果手机拍照。

这个手看着有一点瑕疵,不过大家注意人物的眼球,本来是看着画面正前方,手机掏出来后,明显把目光转向了手机摄像头,这细节就很合理。

提示词:男人转身离开

这个转身还应该配上一句:男人转身,消失在黑暗之中,是不是有点谍战大片的意思了。

除了老照片,还有更多脑洞大开的玩法,最近很火的容嬷嬷喂紫薇吃东西、尔康戴墨镜就是这么玩的。

提示词:唐僧戴墨镜

提示词:尔康喝咖啡

提示词:两个女人跨屏拥抱

提示词:女人戴墨镜

玩了一番下来,我给大家总结了 2 个技巧。

1.选用尽可能清晰的图片,如果原图不够清晰,会影响模型对图片中角色的识别。

2.提示词要简单清晰,比如 按照模板来写: 「主体」+「主题运动」+「背景」+「背景运动」。

这个主体就是你想动起来的人物,如果没有主体, 就会出现崩坏的景象。

如果你不明确大模型如何理解你的图片,你可以将照片发送到清言对话框进行识图,明确你的【主体】该如何描述。

如果实在不知道在提示词上怎么发挥,没关系,智谱还有专门帮写图生视频提示词的智能体,把你的图像主体甩给它,就能帮你写出一个详细的提示词。

文生视频

相比于图生视频来说,文生视频的提示词更加重要, 玩过 AI 绘图的都知道 ,这就是纯念咒语,你只需要提供一些创意性的提示词,清影就能根据这些词生成视频。

提示词:末日来临,穿着宇航服的航天员缓缓朝着飞船走去,眼神中透露着对地球的不舍,注意细节刻画,废土风

提示词:低角度向上推进,缓缓抬头,冰山上突然出现一条恶龙,然后恶龙发现你,冲向你。好莱坞电影风

提示词:蘑菇变成小熊

提示词:两只小熊猫坐在竹林里吃苹果,超近景,纪实风格

提示词:两只猴子在电脑前打工

提示词:由移动的七彩鱼。

发现了吗,文生视频咒语要比图生视频多了很多描述,这个不难理解,简单的提示词虽然也能生成视频,但未必是你想要的效果。

比如你可以用这样的提示词: 小男孩喝咖啡。

如果你对这个画面的效果不满意,那么就需要进阶版的提示词来约束 AI 往哪方面去使劲。

比如,来看看白金段位的高级提示词:[镜头语言]+[光影]+[主体(主体描述)]+[主体运动]+[场景(场景描述)] +[情绪/氛围风格]

还是小男孩喝咖啡这个例子,但是提示词就要详细多了:

摄影机平移(镜头移动), 一个小男孩坐在公园的长椅上(主体描述),手里拿着一杯热气腾腾 的咖啡(主体动作)。他穿着一件蓝色的衬衫,看起来很愉快(主体细节描述),背景是绿树成荫的公园,阳光透 过树叶洒在男孩身上(所处环境描述)。

最后的视频场景也更加真实,细节也更加丰富,不管是冒着热气的咖啡和还是斑驳的阳光,和实拍也没什么差别。

最重要的是,这样生成的视频是最符合你要求的,也就是说,想要生成高质量的视频,你得需要一个足够详细的分镜脚本。

说到这里,你可能会觉得门槛太高,大可不必,说好的“人人都能用”,那就必须安排。

这次智谱还配套发布了清影智能体,你只需要一句话,就会给你一段细节丰富到极致的视觉大片脚本。

比如我就直接只输入钢铁侠和天空两个词。

就能给你生成3个不同风格的提示词。

所以说,有了这个智能体的加持,高级提示词也没有什么门槛,有手你就会。

玩了半天,总的感受是,清影在风景、动物、科幻、人文历史等类型的视频内容上生成的表现较好;

擅长生成的视频风格包括皮克斯风格、卡通风格、摄影风格、动漫风格等;

镜头画面实现效果最好的是近景,也就是特写镜头。

实体类型呈现效果上看,动物 > 植物 > 物品 > 建筑 > 人物。

当然,现阶段 AI 生成视频都是需要多次抽卡的,如果生成的视频不够理想,那就从上面的这些小建议里去修改提示词,多次调教后就会得到你满意的效果。

毕竟这是发布的第一版产品, 按照目前的进度,相信后续优化已经在路上了

对了,都知道,没有 BGM 的视频是没有灵魂的,单纯的视频无疑会少了很多氛围感,清影生成视频后还配有曲库, 你可以直接从中挑选适合的配乐和视频一起导出, 这个功能对于短视频创作者相当友好。

结语

随着「清影」的上线,视频生成赛道又加入了智谱 AI 这位重磅玩家。

总体用下来,给我的感觉是, 国产 AI 的追赶在加速,不管是在文字生成、图像生成还是视频生成上,这个差距是肉眼可见在缩小。

当然,这个清影也会存在视频生成模型中普遍的瑕疵,但是比起其他还在画饼的大模型来说,上线就能用,而且免费不限量,就冲这种诚意,不点赞说不过去。

在我测试的这段时间内,明显感觉到服务器压力在增大,从一开始的等待1分钟左右,到下午的4分钟左右,说明涌来的用户越来越多,所以趁内测免费阶段,大家多上手玩玩吧。

PC 端访问链接: https://chatglm.cn/

移动端访问链接:

https://chatglm.cn/download?fr=web_home







请到「今天看啥」查看全文