用 Python 把 Markdown 玩的明明白白

机器学习算法与Python实战 · 公众号 · · 2024-12-13 10:37

正文

大家好，我是每天都要与 Markdown 打交道的章北海

作为一名开发者， Markdown 的使用是必备技能。无论是写技术文档、博客文章，还是项目 README ， Markdown 都是得力助手。

之前我写过一些 Markdown 相关的工具和教程，比如用于将 Microsoft Word 文档（.docx）转换为 Markdown 格式，同时保留文档中的格式和图片、世界上最好的 Markdown 编辑器，Typora 完全配置指南，Markdown 极简入门、搭建完美写作环境 P7：Markdown 主题美化、知识管理王者，我的第二大脑，Obsidian 配置指南、用GitHub备份Markdown文档，Git简介等等。

Python 作为一门强大的编程语言，提供了丰富的工具来处理和转换 Markdown 内容。本文将为大家介绍 Python 生态中最常用的 Markdown 处理库，帮助你选择合适的工具，并通过实战案例展示如何在实际项目中运用这些库。

主流 `Markdown` 处理库

`python` - `markdown`

最受欢迎的 Markdown 解析库， Django 文档系统的默认选择。

主要特点：

扩展系统丰富
完全符合标准 Markdown 语法
支持自定义扩展
文档完善

基础用法：

import markdown

text = "# 标题\n这是一段**加粗**的文字"
html = markdown.markdown(text)

`mistune`

主要特点：

性能出色
安全性好
扩展性强
代码简洁

基础用法：

import mistune

markdown = mistune.create_markdown()
html = markdown("# 标题\n正文内容")

markdown2

主要特点：

使用简单
功能适中
适合小型项目
安装依赖少

基础用法：

import markdown2

html = markdown2.markdown("# 标题\n正文内容")

如何选择？

如果你需要 丰富的扩展功能 ，选择 python - markdown
如果你注重性能，选择 mistune
如果你想要 简单易用 ，选择 markdown2

实战案例——博客生成器

下面通过一个实际案例，演示如何使用 python - markdown 构建一个简单的技术博客生成器。

这个案例中，实现了：

Markdown 解析和转换
元数据处理
文件操作
HTML 模板生成
批量处理功能

import markdown
import os
from datetime import datetime

class BlogGenerator:
    def __init__(self, posts_dir, output_dir):
        self.posts_dir = posts_dir
        self.output_dir = output_dir
        self.md = markdown.Markdown(extensions=[
            'meta',           # 支持元数据
            'fenced_code',    # 支持代码块
            'tables',         # 支持表格
            'toc'            # 支持目录
        ])
    
    def read_post(self, filename):
        with open(os.path.join(self.posts_dir, filename), 'r', encoding='utf-8') as f:
            content = f.read()
        
        # 转换内容并获取元数据
        html = self.md.convert(content)
        meta = self.md.Meta if hasattr(self.md, 'Meta') else {}
        
        return {
            'content': html,
            'title': meta.get('title', ['无标题'])[0],
            'date': meta.get('date', [datetime.now().strftime('%Y-%m-%d')])[0],
            'tags': meta.get('tags', [])[0].split(',') if meta.get('tags') else []
        }
    
    def generate_html(self, post_data):
        template = """
        html>
        
        
            
            {title}
            
        
        
            
                {title}

                
                    发布日期：{date}
                    标签：{tags}
                

                
                    {content}
                

            

        
        
        """
        return template.format(
            title=post_data['title'],
            date=post_data['date'],
            tags=', '.join(post_data['tags']),
            content=post_data['content']
        )
    
    def generate_blog(self):
        # 确保输出目录存在
        os.makedirs(self.output_dir, exist_ok=True)
        
        # 处理所有 markdown 文件
        for filename in os.listdir(self.posts_dir):

用 Python 把 Markdown 玩的明明白白

正文

主流 Markdown 处理库

python - markdown

mistune (adsbygoogle = window.adsbygoogle || []).push({});

markdown2

实战案例——博客生成器

{title}

请到「今天看啥」查看全文

主流 `Markdown` 处理库

`python` - `markdown`

`mistune`