专栏名称: GitHubStore
分享有意思的开源项目
目录
相关文章推荐
参考消息  ·  霍启刚,当选新职务 ·  昨天  
参考消息  ·  《哪吒2》,破130亿! ·  2 天前  
参考消息  ·  怒了!巴拿马:不与美讨论“谎言” ·  2 天前  
参考消息  ·  突发!以色列多地发生公交车爆炸事件 ·  3 天前  
51好读  ›  专栏  ›  GitHubStore

将PPT 转 Markdown 文件的开源工具:PPTX2MD

GitHubStore  · 公众号  ·  · 2025-02-05 09:45

正文

项目简介

一款 PPT 转 Markdown 文件的开源工具:PPTX2MD。

支持保留标题、列表、粗体、斜体、颜色、超链接、图片、表格以及合并单元格等 PPT 内容格式。

除此之外,还支持将图像内容专为 Markdown,效果颇为不错,有需要的不妨试下。

保留格式

  • 标题。支持模糊匹配的自定义目录。

  • 任意深度的列表。

  • 带有 粗体 斜体 、颜色和超链接的文本

  • 图片。它们被提取到图像文件中并插入相对路径。

  • 具有合并单元格的表格。

  • 从上到下然后从左到右的块顺序。


支持的输出

  • Markdown

  • Tiddlywiki的Wikitext

  • Madoko

  • Quarto



安装和用法

您需要将版本的 python 晚于 3.10 ,并在系统上安装了 PIP ,然后在终端运行:

pip install pptx2md

安装后,请使用命令 pptx2md [pptx filename] PPTX文件 转换为Markdown。


默认的输出文件名 out.md ,并且将提取(并插入.md)的任何图片都放在 /img/ 文件夹中。


注意: 不支持较旧的.ppt文件,首先将其转换为新的.pptx版本。

Upgrade & Remove: 升级和删除:

pip install --upgrade pptx2md
pip uninstall pptx2md

自定义标题

默认情况下,此工具将所有PPTX标题分析为 level 1 标题标题,以获取层次结构的目录,在文件中提供您的预定标题列表并提供 -t 参数。


这是一个示例标题文件 (titles.txt):

Heading 1  Heading 1.1    Heading 1.1.1  Heading 1.2  Heading 1.3Heading 2  Heading 2.1  Heading 2.2    Heading 2.1.1    Heading 2.1.2  Heading 2.3Heading 3


在开始中有空格的第一行被认为是第二级标题,空间的数量是凹痕单位。在这种情况下, Heading 1.1 将以 ## Heading 1.1 输出。由于它在开始时有两个空间,因此2是标题 Heading 1.1.1 的单位,因此以4个空间为 ### Heading 1.1.1 。标题文本与模糊的匹配,无与伦比的PPTX标题将被视为最深的标题。

使用它 pptx2md [filename] -t titles.txt


完整的参数

  • -t [filename] 尝试标题文件

  • -o [filename] 输出文件的路径

  • -i [path] 提取图的目录

  • --image-width [width] 图片的最大宽度,在Px中。 如果设置,则将图像作为HTML IMG标签。

  • --disable-image 禁用图像提取

  • --disable-escaping 不会试图逃脱特殊角色

  • --disable-notes 音符

  • --disable-wmf 保持WMF格式化图像未触及(避免在Linux下例外)

  • --disable-color 禁用颜色标签

  • --enable-slides 拖延幻灯片 \n---\n ,如果要将PPTX幻灯片转换为Markdown幻灯片,这会有所帮助

  • --try-multi-column 尝试检测多柱幻灯片(非常慢)

  • --min-block-size [size] 要输出的文本块的最小字符数量

  • --wiki / --mdk 如果您碰巧使用Tiddlywiki或Madoko,此参数将输出相应的标记语言

  • --qmd 输出到QMD标记语言,用于四分之一动力演示

  • --page [number] 仅转换指定页面

  • --keep-similar-titles 保留类似的标题,并在重复的幻灯片标题中添加“(续)”


注意:安装 wand ,如果需要,可以更好地将WMF图像成功转换。

Screenshots 屏幕截图

Data Link Layer Design Issues  Services Provided to the Network Layer  Framing  Error Control & Flow ControlError Detection and Correction  Error Correcting Code (ECC)  Error Detecting CodeElementary






请到「今天看啥」查看全文