项目简介
一款 PPT 转 Markdown 文件的开源工具:PPTX2MD。
支持保留标题、列表、粗体、斜体、颜色、超链接、图片、表格以及合并单元格等 PPT 内容格式。
除此之外,还支持将图像内容专为 Markdown,效果颇为不错,有需要的不妨试下。
保留格式
-
标题。支持模糊匹配的自定义目录。
-
任意深度的列表。
-
带有
粗体
、
斜体
、颜色和超链接的文本
-
图片。它们被提取到图像文件中并插入相对路径。
-
具有合并单元格的表格。
-
从上到下然后从左到右的块顺序。
支持的输出
-
Markdown
-
Tiddlywiki的Wikitext
-
Madoko
-
Quarto
安装和用法
您需要将版本的
python
晚于
3.10
,并在系统上安装了
PIP
,然后在终端运行:
安装后,请使用命令
pptx2md [pptx filename]
将
PPTX文件
转换为Markdown。
默认的输出文件名
out.md
,并且将提取(并插入.md)的任何图片都放在
/img/
文件夹中。
注意:
不支持较旧的.ppt文件,首先将其转换为新的.pptx版本。
Upgrade & Remove:
升级和删除:
pip install
pip uninstall pptx2md
自定义标题
默认情况下,此工具将所有PPTX标题分析为
level 1
标题标题,以获取层次结构的目录,在文件中提供您的预定标题列表并提供
-t
参数。
这是一个示例标题文件 (titles.txt):
Heading 1
Heading 1.1
Heading 1.1.1
Heading 1.2
Heading 1.3
Heading 2
Heading 2.1
Heading 2.2
Heading 2.1.1
Heading 2.1.2
Heading 2.3
Heading 3
在开始中有空格的第一行被认为是第二级标题,空间的数量是凹痕单位。在这种情况下,
Heading 1.1
将以
## Heading 1.1
输出。由于它在开始时有两个空间,因此2是标题
Heading 1.1.1
的单位,因此以4个空间为
### Heading 1.1.1
。标题文本与模糊的匹配,无与伦比的PPTX标题将被视为最深的标题。
使用它
pptx2md [filename] -t titles.txt
。
完整的参数
-
-t [filename]
尝试标题文件
-
-o [filename]
输出文件的路径
-
-i [path]
提取图的目录
-
--image-width [width]
图片的最大宽度,在Px中。
如果设置,则将图像作为HTML IMG标签。
-
--disable-image
禁用图像提取
-
--disable-escaping
不会试图逃脱特殊角色
-
--disable-notes
音符
-
--disable-wmf
保持WMF格式化图像未触及(避免在Linux下例外)
-
--disable-color
禁用颜色标签
-
--enable-slides
拖延幻灯片
\n---\n
,如果要将PPTX幻灯片转换为Markdown幻灯片,这会有所帮助
-
--try-multi-column
尝试检测多柱幻灯片(非常慢)
-
--min-block-size [size]
要输出的文本块的最小字符数量
-
--wiki
/
--mdk
如果您碰巧使用Tiddlywiki或Madoko,此参数将输出相应的标记语言
-
--qmd
输出到QMD标记语言,用于四分之一动力演示
-
--page [number]
仅转换指定页面
-
--keep-similar-titles
保留类似的标题,并在重复的幻灯片标题中添加“(续)”
注意:安装
wand
,如果需要,可以更好地将WMF图像成功转换。
Screenshots
屏幕截图
Data Link Layer Design Issues
Services Provided to the Network Layer
Framing
Error Control & Flow Control
Error Detection and Correction
Error Correcting Code (ECC)
Error Detecting Code
Elementary