专栏名称: Dance with GenAI
关于生成式人工智能AIGC的一切
51好读  ›  专栏  ›  Dance with GenAI

Deepseek全自动制作哪吒英语动画台词本

Dance with GenAI  · 公众号  ·  · 2025-02-10 19:47

正文

制作英语动画台词本,如果用手工方式费时费力,非常繁琐,如果借助Deepseek等AI工具则可以几乎全部自动化。

第一步,下载动画的srt字幕文件,借助AI将其转换为word文档。

在Deepseek中输入提示词:

你是一个Python编程专家,要完成一个批量将SRT字幕文件转为Word文本文档的任务,具体步骤如下:

打开文件夹:D:\NeZha

读取里面所有的srt字幕文件;

将srt字幕文件里面的时间轴和数字序号全部去掉,只保留字幕文本,另存为word文档;

比如,原有的srt字幕文件内容为:

1

00:01:42,208 --> 00:01:44,875

Over the course

of 1,000 years,

2

00:01:44,916 --> 00:01:47,125

the spiritual energy

of heaven and earth

3

00:01:47,166 --> 00:01:49,916

gave birth to the Chaos Pearl.

转换后的word文档内容为:

Over the course

of 1,000 years,

the spiritual energy

of heaven and earth

gave birth to the Chaos Pearl.

注意:每一步都要输出相关信息

每一行代码都要给出详细的注释

Deepseek给出的回复:

要完成这个任务,我们可以使用Python编写一个脚本,利用os模块来遍历文件夹中的SRT文件,使用re模块来去除时间和数字序号,最后使用python-docx库将处理后的文本保存为Word文档。

以下是完整的Python代码:

python

复制

import os

import re

from docx import Document

# 定义文件夹路径

folder_path = r'D:\NeZha'

# 遍历文件夹中的所有文件

for filename in os.listdir(folder_path):

if filename.endswith('.srt'):

# 构建完整的文件路径

srt_file_path = os.path.join(folder_path, filename)

# 读取SRT文件内容

with open(srt_file_path, 'r', encoding='utf-8') as file:

srt_content = file.read()

# 使用正则表达式去除时间和数字序号

# 匹配时间戳和数字序号的正则表达式

pattern = r'\d+\n\d{2}:\d{2}:\d{2},\d{3} --> \d{2}:\d{2}:\d{2},\d{3}\n'

cleaned_text = re.sub(pattern, '', srt_content)

# 去除多余的空行

cleaned_text = re.sub(r'\n+', '\n', cleaned_text).strip()

# 创建Word文档

doc = Document()

doc.add_paragraph(cleaned_text)

# 构建Word文档的保存路径

word_file_path = os.path.join(folder_path, filename.replace('.srt', '.docx'))

# 保存Word文档

doc.save(word_file_path)

print(f'已转换并保存: {word_file_path}')

print('所有SRT文件已转换完成。')

代码说明:

文件夹遍历:使用os.listdir()遍历指定文件夹中的所有文件,筛选出以.srt结尾的文件。

读取SRT文件:使用open()函数读取SRT文件内容。

正则表达式处理:使用re.sub()函数去除SRT文件中的时间戳和数字序号。

去除多余空行:使用re.sub()函数去除多余的空行。

创建Word文档:使用python-docx库创建一个新的Word文档,并将处理后的文本添加到文档中。

保存Word文档:将生成的Word文档保存到与原SRT文件相同的文件夹中,文件名与SRT文件相同,扩展名改为.docx。

依赖库安装:

在运行此脚本之前,确保你已经安装了python-docx库。如果没有安装,可以使用以下命令进行安装:

bash

复制

pip install python-docx

运行脚本:

将脚本保存为.py文件并运行,脚本会自动处理D:\NeZha文件夹中的所有SRT文件,并将转换后的文本保存为Word文档。

注意事项:

确保SRT文件的编码为UTF-8,否则可能会出现乱码问题。

如果文件夹中有其他非SRT文件,脚本会自动跳过这些文件。

运行程序,得到一个word文档。

第二步,进行视频截图,台词本中用来配图。

输入提示词:







请到「今天看啥」查看全文