专栏名称: GitHub好项目

GitHub上好项目分享；分享 GitHub 上知名的 Python、Java、Web、AI、数据分析等多个领域的优质学习资源、开源项目及开发者工具，为 GitHub 开发者提供优质编程资讯。

开源字符识别 OCR 引擎- 5.7万星星！

GitHub好项目 · 公众号 · · 2024-03-13 00:00

正文

大家好，我是GitHub好项目君，每天分享GitHub上的好项目

我们每天分享开源项目，根据开源协议都可以赚钱

Tesseract 开源 OCR 引擎（主存储库）

镜像代码：

http://www.gitpp.com/rz/tesseract-cn

Tesseract 是一个开源的光学字符识别（OCR）引擎，它能够从图像文件中识别和提取文字。 Tesseract 由 Ray Smith 在 1985 到 1995 年间在惠普公司（Hewlett-Packard）的布里斯托尔实验室开发。在 2005 年，Tesseract 被惠普开源，并且自 2006 年以来，它一直在由 Google 进行维护和开发。

Tesseract 的主要特点包括：

1. 多语言支持：Tesseract 支持多种语言的字符识别，包括英语、中文、阿拉伯语等。

2. 跨平台：Tesseract 可以在多种操作系统上运行，包括Windows、Linux和macOS。

3. 易于集成：Tesseract 提供了命令行工具和API，可以轻松集成到其他应用程序中。

4. 可训练：Tesseract 允许用户训练自己的数据集，以改善特定类型文本的识别准确性。

5. 社区支持：作为一个开源项目，Tesseract 拥有一个活跃的社区，提供持续的技术支持和更新。

Tesseract 的最新版本是 4.x， 它引入了一些新的功能和改进，包括一个基于神经网络（LSTM）的 OCR 引擎，这个新引擎专注于线条识别，并且提供了更好的字符识别性能。Tesseract 4 也与之前的版本兼容，支持旧的 OCR 引擎模式 (--oem0) 和相关的 traineddata 文件。

总的来说，Tesseract 是一个功能强大、灵活且不断进化的 OCR 引擎，它在学术、商业和开源社区中都有广泛的应用。

Tesseract 4 添加了一个新的基于神经网络 (LSTM) 的OCR 引擎，该引擎专注于线条识别，但仍然支持 Tesseract 3 的传统 Tesseract OCR 引擎，该引擎通过识别字符模式进行工作。通过使用旧版 OCR 引擎模式 (--oem 0) 可以实现与 Tesseract 3 的兼容性。它还需要支持旧引擎的经过训练的数据文件，例如来自tessdata存储库的数据文件。

Stefan Weil 是现任首席开发人员。Ray Smith 在 2018 年之前一直是首席开发人员。维护者是 Zdenko Podobny。有关贡献者列表，请参阅作者和 GitHub 的贡献者日志。

Tesseract支持 unicode (UTF-8)，并且可以“开箱即用”识别100 多种语言。

Tesseract 支持多种图像格式，包括 PNG、JPEG 和 TIFF。

Tesseract 支持各种输出格式：纯文本、hOCR (HTML)、PDF、仅不可见文本的 PDF、TSV 和 ALTO。

您应该注意，在许多情况下，为了获得更好的 OCR 结果，您需要提高提供给 Tesseract 的图像质量。

该项目 不包括 GUI 应用程序 。如果您需要，请参阅3rdParty文档。

可以训练Tesseract识别其他语言

Tesseract 开源 OCR 引擎由于其强大的功能和灵活性，被广泛应用于多种环境和场合。

以下是一些常见的使用场景：

1. 文档数字化：将纸质文档转换为可编辑的电子格式，便于存储和检索。

2. 数据提取：从扫描的文档或图像中提取文本数据，用于数据分析和处理。

3. 自动表单处理：识别和提取表单中的文本信息，用于自动化数据处理和录入。

4. 移动应用：集成到移动应用中，实现实时文本识别，如名片识别、文档扫描等。

5. 教育和学术研究：用于书籍和学术论文的文本提取，便于内容分析和索引。

6. 辅助技术：为视障人士提供文本阅读辅助，将文档和图像转换为可听见的文字。

7. 车牌识别：在交通管理系统中用于车牌号码的自动识别。

8. 社交媒体和内容监控：从社交媒体图像中提取文本，用于内容监控和分析。

9. 历史文献数字化：用于古书籍和手稿的文本识别和数字化。

10. 法律和医疗记录处理：自动处理法律文件和医疗记录，提高效率和准确性。

这些场景展示了 Tesseract OCR 引擎的多样性和实用性，它能够在各种不同的环境和需求中发挥作用。

Open3D-查看器应用程序

Open3D-Viewer 是一款独立的 3D 查看器应用程序，可在 Debian (Ubuntu)、macOS 和 Windows 上使用。从发布页面下载 Open3D Viewer 。

开源字符识别 OCR 引擎- 5.7万星星！

正文

Open3D-查看器应用程序

Open3D-ML

请到「今天看啥」查看全文