自从 Sora 画了个大饼之后,似乎就再没听到什么新动静,就像
那个在朋友圈晒了张健身卡照片后,就再也没见他去过健身房的哥们。
可别人都没闲着,继快手可灵前阵子发布之后,就在今天,智谱
AI
突然来了个大招——发布了文生视频大模型
CogVideoX
,
以及基于这一模型推出了
AI 视频应用
清影,
这消息就像突然在朋友圈冒出的健身成果照,让人眼前一亮。
Sora 的套路,就像是那个只会说“下次请你吃饭”但从没兑现的朋友,而智谱这次可是来真的,
上线就是全量开放,所有用户都能用,
同时支持网页版和手机端,只要你把智谱清言更新到最新版本,人人开箱即可使用。
你所需要做的,就只是提供一个画面描述,最快 30 秒,就能得到一个 6 秒的视频,这操作,简直就是请全城的人吃饭,你说谁受得了?
立马翻身下床来玩一波,看看到底是个什么水平。
玩法主要分两种,一种是就是图生视频,在图片基础上生成连贯的画面。
还有一种文生视频,这个玩法就是纯念咒语,玩过 AI 绘图的都知道。
先说图生视频吧,这个功能最开始网友们就用来修复老照片,用 AI 技术把静止的瞬间变得生动起来。
这个功能估计很多人都会感兴趣,毕竟这类视频在短视频平台上出了太多爆款,本来只是亲人的一张静止的老照片,可照片上的人突然冲你微微一笑,这回忆更加动感真切。
对了,这个让老照片动起来的功能还有微信小程序版,只要你有手机,
就能 0 门槛体验这个玩法
。
在微信里面搜索小程序:智谱清言,或者直接点右边的链接
智谱清言
上传老照片就能直接生成视频。
来看看这些效果吧:
提示词:图中男子站起来,风吹起他的头发
原本静止的人,突然就缓缓站了起来,头发被吹起来的细节也很精致。
提示词:图中的老奶奶戴起了耳机
奶奶戴耳机后还添加了摇头晃脑的动作,莫名有一种喜感。
提示词:老人掏出一个苹果手机拍照。
这个手看着有一点瑕疵,不过大家注意人物的眼球,本来是看着画面正前方,手机掏出来后,明显把目光转向了手机摄像头,这细节就很合理。
提示词:男人转身离开
这个转身还应该配上一句:男人转身,消失在黑暗之中,是不是有点谍战大片的意思了。
除了老照片,还有更多脑洞大开的玩法,最近很火的容嬷嬷喂紫薇吃东西、尔康戴墨镜就是这么玩的。
提示词:唐僧戴墨镜
提示词:尔康喝咖啡
提示词:两个女人跨屏拥抱
提示词:女人戴墨镜
玩了一番下来,我给大家总结了 2 个技巧。
1.选用尽可能清晰的图片,如果原图不够清晰,会影响模型对图片中角色的识别。
2.提示词要简单清晰,比如
按照模板来写:
「主体」+「主题运动」+「背景」+「背景运动」。
这个主体就是你想动起来的人物,如果没有主体, 就会出现崩坏的景象。
如果你不明确大模型如何理解你的图片,你可以将照片发送到清言对话框进行识图,明确你的【主体】该如何描述。
如果实在不知道在提示词上怎么发挥,没关系,智谱还有专门帮写图生视频提示词的智能体,把你的图像主体甩给它,就能帮你写出一个详细的提示词。
相比于图生视频来说,文生视频的提示词更加重要,
玩过 AI 绘图的都知道
,这就是纯念咒语,你只需要提供一些创意性的提示词,清影就能根据这些词生成视频。
提示词:末日来临,穿着宇航服的航天员缓缓朝着飞船走去,眼神中透露着对地球的不舍,注意细节刻画,废土风
提示词:低角度向上推进,缓缓抬头,冰山上突然出现一条恶龙,然后恶龙发现你,冲向你。好莱坞电影风
提示词:蘑菇变成小熊
提示词:两只小熊猫坐在竹林里吃苹果,超近景,纪实风格
提示词:两只猴子在电脑前打工
提示词:由移动的七彩鱼。
发现了吗,文生视频咒语要比图生视频多了很多描述,这个不难理解,简单的提示词虽然也能生成视频,但未必是你想要的效果。
比如你可以用这样的提示词:
小男孩喝咖啡。
如果你对这个画面的效果不满意,那么就需要进阶版的提示词来约束 AI 往哪方面去使劲。
比如,来看看白金段位的高级提示词:[镜头语言]+[光影]+[主体(主体描述)]+[主体运动]+[场景(场景描述)] +[情绪/氛围风格]
还是小男孩喝咖啡这个例子,但是提示词就要详细多了:
摄影机平移(镜头移动),
一个小男孩坐在公园的长椅上(主体描述),手里拿着一杯热气腾腾
的咖啡(主体动作)。他穿着一件蓝色的衬衫,看起来很愉快(主体细节描述),背景是绿树成荫的公园,阳光透
过树叶洒在男孩身上(所处环境描述)。
最后的视频场景也更加真实,细节也更加丰富,不管是冒着热气的咖啡和还是斑驳的阳光,和实拍也没什么差别。
最重要的是,这样生成的视频是最符合你要求的,也就是说,想要生成高质量的视频,你得需要一个足够详细的分镜脚本。
说到这里,你可能会觉得门槛太高,大可不必,说好的“人人都能用”,那就必须安排。
这次智谱还配套发布了清影智能体,你只需要一句话,就会给你一段细节丰富到极致的视觉大片脚本。
所以说,有了这个智能体的加持,高级提示词也没有什么门槛,有手你就会。
玩了半天,总的感受是,清影在风景、动物、科幻、人文历史等类型的视频内容上生成的表现较好;
擅长生成的视频风格包括皮克斯风格、卡通风格、摄影风格、动漫风格等;
镜头画面实现效果最好的是近景,也就是特写镜头。
实体类型呈现效果上看,动物 > 植物 > 物品 > 建筑 > 人物。
当然,现阶段 AI 生成视频都是需要多次抽卡的,如果生成的视频不够理想,那就从上面的这些小建议里去修改提示词,多次调教后就会得到你满意的效果。
毕竟这是发布的第一版产品,
按照目前的进度,相信后续优化已经在路上了
。
对了,都知道,没有 BGM 的视频是没有灵魂的,单纯的视频无疑会少了很多氛围感,清影生成视频后还配有曲库,
你可以直接从中挑选适合的配乐和视频一起导出,
这个功能对于短视频创作者相当友好。
结语
随着「清影」的上线,视频生成赛道又加入了智谱 AI 这位重磅玩家。
总体用下来,给我的感觉是,
国产 AI 的追赶在加速,不管是在文字生成、图像生成还是视频生成上,这个差距是肉眼可见在缩小。
当然,这个清影也会存在视频生成模型中普遍的瑕疵,但是比起其他还在画饼的大模型来说,上线就能用,而且免费不限量,就冲这种诚意,不点赞说不过去。
在我测试的这段时间内,明显感觉到服务器压力在增大,从一开始的等待1分钟左右,到下午的4分钟左右,说明涌来的用户越来越多,所以趁内测免费阶段,大家多上手玩玩吧。
PC 端访问链接:
https://chatglm.cn/
移动端访问链接:
https://chatglm.cn/download?fr=web_home