专栏名称: Dance with GenAI
关于生成式人工智能AIGC的一切
目录
相关文章推荐
神嘛事儿  ·  我回答了 @有钳人28 ... ·  13 小时前  
央视财经  ·  普京重要表态! ·  2 天前  
洪灝的宏观策略  ·  昨夜,美股经历了2025年以来最差的一天 ... ·  2 天前  
e公司官微  ·  华为,重磅发布!百万豪车,黑科技现身! ·  3 天前  
21世纪经济报道  ·  彻底爆了,传A股董秘发圈庆贺股价大涨!机器人 ... ·  3 天前  
51好读  ›  专栏  ›  Dance with GenAI

AI办公自动化:用kimi批量把word转换成txt文本

Dance with GenAI  · 公众号  ·  · 2024-05-15 07:43

正文

在Kimichat中输入提示词:

你是一个Python编程专家,要完成一个Python脚本编写的任务,具体步骤如下:

打开文件夹:F:\aword

读取里面docx格式的word文档,

提取word文档中的第一行文字作为txt文本文档的标题名,

将word文档转换为txt文档;

重命名txt文档;

注意:每一步相关信息都要输出到屏幕;

在 Windows 系统中,默认的文件编码是 GBK,它不支持某些特殊的 Unicode 字符,为了解决这个问题,可以在打开文件进行写入操作时,指定使用 utf-8 编码

kimichat生成Python源代码:

import os

from docx import Document

# 定义文件夹路径

folder_path = 'F:\\aword'

# 确保文件夹存在

if not os.path.exists(folder_path):

print(f"文件夹 {folder_path} 不存在。")

else:

# 列出文件夹中所有的docx文件

docx_files = [f for f in os.listdir(folder_path) if f.endswith('.docx')]

# 检查是否有docx文件

if not docx_files:

print("没有找到docx格式的Word文档。")

else:

for docx_file in docx_files:

# 构建完整的文件路径

docx_file_path = os.path.join(folder_path, docx_file)

# 读取Word文档

doc = Document(docx_file_path)

try:

# 提取第一行文字作为标题

title = doc.paragraphs[0].text.strip()

print(f"提取的标题为: {title}")

# 构建txt文件的完整路径

txt_file_path = os.path.join(folder_path, f"{title}.txt")

# 将Word文档转换为txt







请到「今天看啥」查看全文