专栏名称: GitHubStore
分享有意思的开源项目
目录
相关文章推荐
秋叶PPT  ·  《演员请就位3》被骂恶心,网友:看吐了! ·  15 小时前  
跟我学个P  ·  清华大学的这份《DeepSeek》PPT手册 ... ·  3 天前  
旁门左道PPT  ·  敦煌这张PPT美爆了!竟然是国产AI做的!! ·  4 天前  
51好读  ›  专栏  ›  GitHubStore

PPT 转Markdown工具 PPTX2MD

GitHubStore  · 公众号  · PPT  · 2024-08-02 13:28

主要观点总结

文章介绍了一个将Powerpoint pptx文件转换为markdown的工具,包括其安装、使用、功能特点等。

关键观点总结

关键观点1: 工具功能

该工具能够转换pptx文件到markdown格式,保留格式、标题、列表、文本样式、图片和表格等。输出支持Markdown、Tiddlywiki的维基文本、Madoko等多种格式。

关键观点2: 安装与使用

需要安装Python 3.6以上版本和pip,然后在终端中运行pip install pptx2md进行安装。使用命令pptx2md [pptx filename]进行转换,默认输出文件名是out.md,图片插入在/img/文件夹中。

关键观点3: 自定义标题

工具支持提供预定义的标题列表,通过-t参数使用标题文件,实现模糊匹配的自定义目录。还提供其他参数如输出文件的路径、图片目录、图片最大宽度等。

关键观点4: 特点与注意事项

工具具有合并单元格的表格支持、按照块顺序从上到下从左到右转换、不支持旧的.ppt文件需先转为.pptx版本等特点。另外,还提供了针对幻灯片转换、预设主题颜色样式解析等详细解析规则。


正文

项目简介

一个将Powerpoint pptx文件转换为markdown的工具。

保留格式:

  • 标题。支持模糊匹配的自定义目录。

  • 任意深度的列表。

  • 带有 粗体 斜体 、颜色和超链接的文本

  • 图片。它们被提取到图像文件中并插入相对路径。

  • 具有合并单元格的表格。

  • 从上到下然后从左到右的块顺序。


支持的输出:

  • Markdown

  • Tiddlywiki的维基文本

  • Madoko

如果您喜欢,请为这个仓库加注星标!

安装与使用

安装

您的系统上需要安装 Python 3.6 以上版本并安装 pip ,然后在终端中运行:

pip install pptx2md

用法

安装后,使用命令 pptx2md [pptx filename] pptx 文件 转换为 markdown。

默认输出文件名是 out.md ,任何提取的图片(并插入到 .md 中)都将放置在 /img/ 文件夹中。

注意: 不支持旧的 .ppt 文件,请先将其转换为新的 .pptx 版本。

升级和删除:

pip install --upgrade pptx2md
pip uninstall pptx2md

自定义标题

默认情况下,该工具将所有 pptx 标题解析为 level 1 Markdown 标题,以便获得分层目录,在文件中提供预定义的标题列表并为其提供 -t 参数。

这是一个示例标题文件 (titles.txt):

Heading 1  Heading 1.1    Heading 1.1.1  Heading 1.2  Heading 1.3Heading 2  Heading 2.1  Heading 2.2    Heading 2.1.1    Heading 2.1.2  Heading 2.3Heading 3

开头有空格的第一行被视为二级标题,空格数为缩进单位。在这种情况下, Heading 1.1 将输出为 ## Heading 1.1 。由于开头有两个空格,标题缩进单位为 2,因此带有 4 个空格的 Heading 1.1.1 将输出为 ### Heading 1.1.1 。标题文本采用模糊匹配方式进行匹配,未匹配的pptx标题将被视为最深的标题。

将其与 pptx2md [filename] -t titles.txt 一起使用。

其他参数

  • -t [filename] 提供标题文件

  • -o [filename] 输出文件的路径

  • -i [path] 提取图片的目录

  • --image-width [width] 图片的最大宽度,单位为px。 如果设置,图像将作为 html img 标签放置。

  • --disable-image 禁用图像提取

  • --disable-escaping 不要尝试转义特殊字符

  • --disable-notes 不添加演示者注释

  • --disable-wmf 保持wmf格式的图像不变(避免linux下的异常)

  • --disable-color 禁用 HTML 中的颜色标签

  • --enable-slides 定义幻灯片 \n---\n ,如果您想将 pptx 幻灯片转换为 markdown 幻灯片,这会有所帮助

  • --min-block-size [size] 要输出的文本块的最小字符数

  • --wiki / --mdk 如果您碰巧使用 tiddlywiki 或 madoko,此参数输出相应的标记语言

  • --qmd 输出到用于四开演示的 qmd 标记语言。它还具有一个简单的方法来推断每张幻灯片的列数。


注意:如果需要,安装wand可以更好地成功转换 wmf 图像。

截图

Data Link Layer Design Issues  Services Provided to the Network Layer  Framing  Error Control & Flow ControlError Detection and Correction  Error Correcting Code (ECC)  Error Detecting CodeElementary Data Link ProtocolsSliding Window Protocols  One-Bit Sliding Window Protocol  Protocol Using Go Back N  Using Selective RepeatPerformance of Sliding Window ProtocolsExample Data Link Protocols  PPP

  • 顶部 :标题列表文件内容。

  • 底部 :生成的目录。







请到「今天看啥」查看全文