专栏名称: 科技阿水
我是阿水,喜欢科技,喜欢浪~ 阿水AI官方公众号
目录
相关文章推荐
极光新闻 东北网  ·  黑龙江造 | 革故鼎新 向新求变 ·  昨天  
极光新闻 东北网  ·  黑龙江造 | 革故鼎新 向新求变 ·  昨天  
BRTV建外14号  ·  刘晓庆紧急回应:不是我! ·  2 天前  
BRTV建外14号  ·  刘晓庆紧急回应:不是我! ·  2 天前  
云南省生态环境厅  ·  省生态环境厅党组成员、驻厅纪检监察组组长王福 ... ·  2 天前  
西安晚报  ·  突发!苹果手机出事了!用的人快看→ ·  2 天前  
西安晚报  ·  突发!苹果手机出事了!用的人快看→ ·  2 天前  
51好读  ›  专栏  ›  科技阿水

万万没想到,AI还有这种神仙用法!

科技阿水  · 公众号  · 科技自媒体  · 2025-01-03 11:00

主要观点总结

文章介绍了剪映软件中的字幕识别功能的变化以及新的字幕识别工具的使用。随着AI的发展,字幕识别工具越来越普及和高效,其中卡卡字幕助手是一款基于AI大模型的字幕识别工具,可以通过本地模型和在线大语言模型进行字幕识别,并支持多种格式的字幕文件导出。文章还介绍了软件的安装流程和使用方法,并提到了参与活动的中奖粉丝名单。

关键观点总结

关键观点1: 剪映软件字幕识别功能的变化

剪映是最受欢迎的视频剪辑软件之一,其字幕识别功能很有特色。但免费额度减少,引发用户寻找其他工具的需求。

关键观点2: 卡卡字幕助手的介绍

卡卡字幕助手是一款基于AI大模型开发的字幕识别工具,可以通过本地模型和在线大语言模型进行字幕识别,支持多种格式的字幕文件导出,有效提高视频制作效率。

关键观点3: 软件的安装流程和使用方法

文章详细介绍了卡卡字幕助手的安装流程和使用方法,包括本地模型和在线大语言模型的使用,以及字幕识别的具体操作。

关键观点4: 软件的适用人群和优势

软件不仅适用于专业视频创作者,也适用于影视爱好者或影视老司机,能解决观影中存在的语言障碍。

关键观点5: 参与活动的方式和奖品

文章最后提到了参与活动的中奖粉丝名单,并鼓励大家参与公众号活动,通过关键词回复获取相关工具,并有机会获得GPT4.0+3.5+MJ全家桶套装。


正文


科技阿水
软件/科技//教程/技术
关注

大家好,我是阿水 (开奖已放在文末)

作为国内最受欢迎的视频剪辑软件之一,剪映中最具特色的功能就是其免费的字幕识别。

但是,自去年五月起,剪映开始削减免费有用户所能白嫖的福利 ,其中字幕就是影响大的一项。


每月五次的免费额度,着实是少了点。哪怕不是专业视频创作者,每月稍微多做几条视频,额度用完也是轻轻松松。

毕竟发视频的频率又不如专业视频创作者高,如果每月花费开通会员,却又无法 通过视频获得收益,着实不划算。

但随着AI的普及和应用,需要更加好用、更加方便的字幕识别工具也纷纷问世,可有效提高视频制作效率。

卡卡字幕助手(电脑)


卡卡字幕助手是一款基于AI大模型开发的字幕识别工具,只要接入对应的大模型接口,或者下载本地模型,即可对视频或者音频中的字幕进行提取,并生成srt等格式的字幕文件。

软件安装流程比较常规,这里就不过多赘述了。


支持本地模型Whisper和LLM(大语言模型)API接入识别两种方式,大家可以按需选择。


先看本地的Whisper模型, 使用前需要先根据配置安装GPU+CPU使用或者CPU使用的模型底包,然后下载用于识别的模型 。模型体积越大,识别效果也就越好,但对设 备性能的要 求也在提高


阿水为核显,这里就下载CPU版版本的Faster Whisper,然后下载Medium模型。 下载完成后,打开Faster Whisper设置,选择之前下载的模型、运行设备、音频的语言即可。


软件使用就比较简单了,把需要识别的视频或者音频文件拖进来,点击开始,就会对其进行自动处理,使用本地模型的情况下,速度快慢就看设备性能了。


Faster Whisper模型转录完成后,会利用AI,对识别结果进行优化,确认字幕呜呜后,点击左上角的保存,即可导出srt、ass、vtt等格式的字幕文件。


如果优化后仍旧存在错别字,可以手动点击,进行修改。


然后,咱们再看在线大语言模型 识别。可以填入OPENAI官方的API接口或者使用第三方提供的接口,接入各种开放API接口的大语言模型。

填入API Key、Base URL后,点击检查连接,当弹出模型获取成功、LLM连接成功的提示时,就说明大模型接入成功!


使用LLM模型时,需要在首页将转录模型设置为B接口。


至于后面的操作,就和使用Faster Whisper模型一模一样,直接抄前面的作业即可

值得一提的是,得益于云端强大的计算能力,通过LLM API所进行的字幕识别,速度要远远高于本地识别(如果本地GPU算力比较强大,影响则可pass)。






请到「今天看啥」查看全文