制作英语动画台词本,如果用手工方式费时费力,非常繁琐,如果借助Deepseek等AI工具则可以几乎全部自动化。
第一步,下载动画的srt字幕文件,借助AI将其转换为word文档。
在Deepseek中输入提示词:
你是一个Python编程专家,要完成一个批量将SRT字幕文件转为Word文本文档的任务,具体步骤如下:
打开文件夹:D:\NeZha
读取里面所有的srt字幕文件;
将srt字幕文件里面的时间轴和数字序号全部去掉,只保留字幕文本,另存为word文档;
比如,原有的srt字幕文件内容为:
1
00:01:42,208 --> 00:01:44,875
Over the course
of 1,000 years,
2
00:01:44,916 --> 00:01:47,125
the spiritual energy
of heaven and earth
3
00:01:47,166 --> 00:01:49,916
gave birth to the Chaos Pearl.
转换后的word文档内容为:
Over the course
of 1,000 years,
the spiritual energy
of heaven and earth
gave birth to the Chaos Pearl.
注意:每一步都要输出相关信息
每一行代码都要给出详细的注释
Deepseek给出的回复:
要完成这个任务,我们可以使用Python编写一个脚本,利用os模块来遍历文件夹中的SRT文件,使用re模块来去除时间和数字序号,最后使用python-docx库将处理后的文本保存为Word文档。
以下是完整的Python代码:
python
复制
import os
import re
from docx import Document
# 定义文件夹路径
folder_path = r'D:\NeZha'
# 遍历文件夹中的所有文件
for filename in os.listdir(folder_path):
if filename.endswith('.srt'):
# 构建完整的文件路径
srt_file_path = os.path.join(folder_path, filename)
# 读取SRT文件内容
with open(srt_file_path, 'r', encoding='utf-8') as file:
srt_content = file.read()
# 使用正则表达式去除时间和数字序号
# 匹配时间戳和数字序号的正则表达式
pattern = r'\d+\n\d{2}:\d{2}:\d{2},\d{3} --> \d{2}:\d{2}:\d{2},\d{3}\n'
cleaned_text = re.sub(pattern, '', srt_content)
# 去除多余的空行
cleaned_text = re.sub(r'\n+', '\n', cleaned_text).strip()
# 创建Word文档
doc = Document()
doc.add_paragraph(cleaned_text)
# 构建Word文档的保存路径
word_file_path = os.path.join(folder_path, filename.replace('.srt', '.docx'))
# 保存Word文档
doc.save(word_file_path)
print(f'已转换并保存: {word_file_path}')
print('所有SRT文件已转换完成。')
代码说明:
文件夹遍历:使用os.listdir()遍历指定文件夹中的所有文件,筛选出以.srt结尾的文件。
读取SRT文件:使用open()函数读取SRT文件内容。
正则表达式处理:使用re.sub()函数去除SRT文件中的时间戳和数字序号。
去除多余空行:使用re.sub()函数去除多余的空行。
创建Word文档:使用python-docx库创建一个新的Word文档,并将处理后的文本添加到文档中。
保存Word文档:将生成的Word文档保存到与原SRT文件相同的文件夹中,文件名与SRT文件相同,扩展名改为.docx。
依赖库安装:
在运行此脚本之前,确保你已经安装了python-docx库。如果没有安装,可以使用以下命令进行安装:
bash
复制
pip install python-docx
运行脚本:
将脚本保存为.py文件并运行,脚本会自动处理D:\NeZha文件夹中的所有SRT文件,并将转换后的文本保存为Word文档。
注意事项:
确保SRT文件的编码为UTF-8,否则可能会出现乱码问题。
如果文件夹中有其他非SRT文件,脚本会自动跳过这些文件。
运行程序,得到一个word文档。
第二步,进行视频截图,台词本中用来配图。
输入提示词: