微软发布了markitdown,用于将各种文件转换为Markdown的Python工具。
#ai创造营#
#程序员#
支持:
- PDF(.pdf)
- PowerPoint (.pptx)
- Word (.docx)
- Excel (.xlsx)
- 图像(EXIF 元数据和 OCR)
- 音频(EXIF 元数据和语音转录)
- HTML(维基百科等的特殊处理)
- 各种其他基于文本的格式(csv、json、xml 等)
访问:github.com/microsoft/markitdown
支持:
- PDF(.pdf)
- PowerPoint (.pptx)
- Word (.docx)
- Excel (.xlsx)
- 图像(EXIF 元数据和 OCR)
- 音频(EXIF 元数据和语音转录)
- HTML(维基百科等的特殊处理)
- 各种其他基于文本的格式(csv、json、xml 等)
访问:github.com/microsoft/markitdown