专栏名称: Dance with GenAI

关于生成式人工智能AIGC的一切

Deepseek全自动制作哪吒英语动画台词本

Dance with GenAI · 公众号 · · 2025-02-10 19:47

正文

制作英语动画台词本，如果用手工方式费时费力，非常繁琐，如果借助Deepseek等AI工具则可以几乎全部自动化。

第一步，下载动画的srt字幕文件，借助AI将其转换为word文档。

在Deepseek中输入提示词：

你是一个Python编程专家，要完成一个批量将SRT字幕文件转为Word文本文档的任务，具体步骤如下：

打开文件夹：D:\NeZha

读取里面所有的srt字幕文件；

将srt字幕文件里面的时间轴和数字序号全部去掉，只保留字幕文本，另存为word文档；

比如，原有的srt字幕文件内容为：

00:01:42,208 --> 00:01:44,875

Over the course

of 1,000 years,

00:01:44,916 --> 00:01:47,125

the spiritual energy

of heaven and earth

00:01:47,166 --> 00:01:49,916

gave birth to the Chaos Pearl.

转换后的word文档内容为：

Over the course

of 1,000 years,

the spiritual energy

of heaven and earth

gave birth to the Chaos Pearl.

注意：每一步都要输出相关信息

每一行代码都要给出详细的注释

Deepseek给出的回复：

要完成这个任务，我们可以使用Python编写一个脚本，利用os模块来遍历文件夹中的SRT文件，使用re模块来去除时间和数字序号，最后使用python-docx库将处理后的文本保存为Word文档。

以下是完整的Python代码：

python

复制

import os

import re

from docx import Document

# 定义文件夹路径

folder_path = r'D:\NeZha'

# 遍历文件夹中的所有文件

for filename in os.listdir(folder_path):

if filename.endswith('.srt'):

# 构建完整的文件路径

srt_file_path = os.path.join(folder_path, filename)

# 读取SRT文件内容

with open(srt_file_path, 'r', encoding='utf-8') as file:

srt_content = file.read()

# 使用正则表达式去除时间和数字序号

# 匹配时间戳和数字序号的正则表达式

pattern = r'\d+\n\d{2}:\d{2}:\d{2},\d{3} --> \d{2}:\d{2}:\d{2},\d{3}\n'

cleaned_text = re.sub(pattern, '', srt_content)

# 去除多余的空行

cleaned_text = re.sub(r'\n+', '\n', cleaned_text).strip()

# 创建Word文档

doc = Document()

doc.add_paragraph(cleaned_text)

# 构建Word文档的保存路径

word_file_path = os.path.join(folder_path, filename.replace('.srt', '.docx'))

# 保存Word文档

doc.save(word_file_path)

print(f'已转换并保存: {word_file_path}')

print('所有SRT文件已转换完成。')

代码说明：

文件夹遍历：使用os.listdir()遍历指定文件夹中的所有文件，筛选出以.srt结尾的文件。

读取SRT文件：使用open()函数读取SRT文件内容。

正则表达式处理：使用re.sub()函数去除SRT文件中的时间戳和数字序号。

去除多余空行：使用re.sub()函数去除多余的空行。

创建Word文档：使用python-docx库创建一个新的Word文档，并将处理后的文本添加到文档中。

保存Word文档：将生成的Word文档保存到与原SRT文件相同的文件夹中，文件名与SRT文件相同，扩展名改为.docx。

依赖库安装：

在运行此脚本之前，确保你已经安装了python-docx库。如果没有安装，可以使用以下命令进行安装：

bash

复制

pip install python-docx

运行脚本：

将脚本保存为.py文件并运行，脚本会自动处理D:\NeZha文件夹中的所有SRT文件，并将转换后的文本保存为Word文档。

注意事项：

确保SRT文件的编码为UTF-8，否则可能会出现乱码问题。

如果文件夹中有其他非SRT文件，脚本会自动跳过这些文件。

运行程序，得到一个word文档。

第二步，进行视频截图，台词本中用来配图。

输入提示词:

Deepseek全自动制作哪吒英语动画台词本

正文

请到「今天看啥」查看全文