专栏名称: GitHub好项目

GitHub上好项目分享；分享 GitHub 上知名的 Python、Java、Web、AI、数据分析等多个领域的优质学习资源、开源项目及开发者工具，为 GitHub 开发者提供优质编程资讯。

开箱即用，一键语音转文字并翻译

GitHub好项目 · 公众号 · · 2024-06-02 09:41

正文

大家好，我是GitHub好项目君，每天分享GitHub上的好项目

我们每天分享开源项目，根据开源协议都可以赚钱

由 OpenAI 的 Whisper 提供，支持离线将音频或视频中的语音转换为文本

源代码：

http://www.gitpp.com/kysq/buzz

前言

OpenAI Whisper 是一个广为人知的语音转文字工具，它具备出色的功能和准确性，然而，对于大多数普通用户而言，直接操作它可能仍有一定难度。

因此，我为大家推荐 GitHub 上的一款名为 Buzz 的音频转录和翻译工具。这款工具基于 Whisper 开发，不仅完全开源免费，而且界面设计简洁，操作便捷。通过它，用户可以轻松实现音频或视频中的语音到文本的转换，而且整个过程可以在本地电脑上离线完成。

项目介绍

Buzz 是一款利用 OpenAI 的 Whisper 模型进行离线转录和翻译音频的应用程序。Whisper 是一个由 OpenAI 开发的自动语音识别 (ASR) 模型，专门设计用于处理多种语言的音频数据，包括转录和翻译。Whisper 模型的一个关键特点是它能够在没有网络连接的情况下运行，这意味着 Buzz 可以在用户的个人计算机上离线工作，为用户提供便捷的音频处理服务。

Buzz 的主要功能包括：

离线转录：用户可以直接在本地计算机上转录音频文件，无需将数据发送到云端服务器，这提高了数据隐私和安全性。
多语言翻译：Buzz 支持多种语言的转录和翻译，这使得它成为一个适用于多种语言环境的强大工具。
易于使用：Buzz 提供了一个用户友好的界面，使得即使是对于非技术用户来说，转录和翻译过程也非常直观和简单。
高度准确：由于使用了先进的 Whisper 模型，Buzz 能够提供高准确度的转录和翻译结果。
隐私保护：由于所有处理都在本地进行，Buzz 可以保护用户的隐私，避免敏感数据通过互联网传输。

Buzz 的应用场景广泛，包括但不限于个人笔记整理、会议记录、教育资料转录、多语种内容创建等。它特别适合那些需要处理大量音频数据，同时又对数据隐私和安全有较高要求的用户。

主要提供了以下功能：

支持实时进行语音转录和翻译（需麦克风）。
支持导入音视频文件（MP3、WAV、MP4 等），并导出逐句或逐字字幕文件（SRT、TXT、VTT）。

同时，为了提升用户的使用体验，Buzz 贴心地提供了多种模型选择，让用户能够根据自己的电脑配置找到最合适的模型。

无论你是使用 macOS、Windows 还是 Linux 系统，都可以在该项目的 releases 页面找到相应的工具安装包。

开箱即用，一键语音转文字并翻译

正文

请到「今天看啥」查看全文