专栏名称: GitHub好项目
GitHub上好项目分享;分享 GitHub 上知名的 Python、Java、Web、AI、数据分析等多个领域的优质学习资源、开源项目及开发者工具,为 GitHub 开发者提供优质编程资讯。
目录
相关文章推荐
国家外汇管理局  ·  【总台央视】激情亚冬 逐梦冰雪 ... ·  昨天  
国家外汇管理局  ·  习近平在听取吉林省委和省政府工作汇报时强调 ... ·  4 天前  
国家外汇管理局  ·  习近平对四川宜宾市筠连县山体滑坡作出重要指示 ·  4 天前  
51好读  ›  专栏  ›  GitHub好项目

开源字符识别 OCR 引擎- 5.7万星星!

GitHub好项目  · 公众号  ·  · 2024-03-13 00:00

正文

大家好,我是GitHub好项目君,每天分享GitHub上的好项目

我们每天分享开源项目,根据开源协议都可以赚钱

Tesseract 开源 OCR 引擎(主存储库)

镜像代码:

http://www.gitpp.com/rz/tesseract-cn

Tesseract 是一个开源的光学字符识别(OCR)引擎,它能够从图像文件中识别和提取文字。 Tesseract 由 Ray Smith 在 1985 到 1995 年间在惠普公司(Hewlett-Packard)的布里斯托尔实验室开发。在 2005 年,Tesseract 被惠普开源,并且自 2006 年以来,它一直在由 Google 进行维护和开发。

Tesseract 的主要特点包括:

1. 多语言支持:Tesseract 支持多种语言的字符识别,包括英语、中文、阿拉伯语等。

2. 跨平台:Tesseract 可以在多种操作系统上运行,包括Windows、Linux和macOS。

3. 易于集成:Tesseract 提供了命令行工具和API,可以轻松集成到其他应用程序中。

4. 可训练:Tesseract 允许用户训练自己的数据集,以改善特定类型文本的识别准确性。

5. 社区支持:作为一个开源项目,Tesseract 拥有一个活跃的社区,提供持续的技术支持和更新。

Tesseract 的最新版本是 4.x, 它引入了一些新的功能和改进,包括一个基于神经网络(LSTM)的 OCR 引擎,这个新引擎专注于线条识别,并且提供了更好的字符识别性能。Tesseract 4 也与之前的版本兼容,支持旧的 OCR 引擎模式 (--oem0) 和相关的 traineddata 文件。

总的来说,Tesseract 是一个功能强大、灵活且不断进化的 OCR 引擎,它在学术、商业和开源社区中都有广泛的应用。

Tesseract 4 添加了一个新的基于神经网络 (LSTM) 的OCR 引擎,该引擎专注于线条识别,但仍然支持 Tesseract 3 的传统 Tesseract OCR 引擎,该引擎通过识别字符模式进行工作。通过使用旧版 OCR 引擎模式 (--oem 0) 可以实现与 Tesseract 3 的兼容性。它还需要支持旧引擎的经过训练的数据文件,例如来自tessdata存储库的数据文件。

Stefan Weil 是现任首席开发人员。Ray Smith 在 2018 年之前一直是首席开发人员。维护者是 Zdenko Podobny。有关贡献者列表,请参阅作者 和 GitHub 的贡献者日志。

Tesseract支持 unicode (UTF-8),并且可以“开箱即用”识别100 多种语言。

Tesseract 支持多种图像格式,包括 PNG、JPEG 和 TIFF。

Tesseract 支持各种输出格式:纯文本、hOCR (HTML)、PDF、仅不可见文本的 PDF、TSV 和 ALTO。

您应该注意,在许多情况下,为了获得更好的 OCR 结果,您需要提高提供给 Tesseract 的图像质量。

该项目 不包括 GUI 应用程序 。如果您需要,请参阅3rdParty文档。

可以训练Tesseract识别其他语言

Tesseract 开源 OCR 引擎由于其强大的功能和灵活性,被广泛应用于多种环境和场合。

以下是一些常见的使用场景:

1. 文档数字化: 将纸质文档转换为可编辑的电子格式,便于存储和检索。

2. 数据提取: 从扫描的文档或图像中提取文本数据,用于数据分析和处理。

3. 自动表单处理: 识别和提取表单中的文本信息,用于自动化数据处理和录入。

4. 移动应用: 集成到移动应用中,实现实时文本识别,如名片识别、文档扫描等。

5. 教育和学术研究: 用于书籍和学术论文的文本提取,便于内容分析和索引。

6. 辅助技术: 为视障人士提供文本阅读辅助,将文档和图像转换为可听见的文字。

7. 车牌识别: 在交通管理系统中用于车牌号码的自动识别。

8. 社交媒体和内容监控: 从社交媒体图像中提取文本,用于内容监控和分析。

9. 历史文献数字化: 用于古书籍和手稿的文本识别和数字化。

10. 法律和医疗记录处理: 自动处理法律文件和医疗记录,提高效率和准确性。

这些场景展示了 Tesseract OCR 引擎的多样性和实用性,它能够在各种不同的环境和需求中发挥作用。

Open3D-查看器应用程序

Open3D-Viewer 是一款独立的 3D 查看器应用程序,可在 Debian (Ubuntu)、macOS 和 Windows 上使用。从发布页面 下载 Open3D Viewer 。

Open3D-ML







请到「今天看啥」查看全文