专栏名称: GitHub好项目
GitHub上好项目分享;分享 GitHub 上知名的 Python、Java、Web、AI、数据分析等多个领域的优质学习资源、开源项目及开发者工具,为 GitHub 开发者提供优质编程资讯。
目录
相关文章推荐
吉安公安  ·  悬赏执行公告! ·  2 天前  
河北高院  ·  纠正“小过重罚”,彰显司法温度 ·  3 天前  
最高人民检察院  ·  习近平在听取吉林省委和省政府工作汇报时强调 ... ·  4 天前  
51好读  ›  专栏  ›  GitHub好项目

开箱即用,一键语音转文字并翻译

GitHub好项目  · 公众号  ·  · 2024-04-12 00:00

正文

大家好,我是GitHub好项目君,每天分享GitHub上的好项目

我们每天分享开源项目,根据开源协议都可以赚钱

由 OpenAI 的 Whisper 提供,支持离线将音频或视频中的语音转换为文本

镜像代码:

http://www.gitpp.com/kysq/buzz

前言

OpenAI Whisper 是一个广为人知的语音转文字工具,它具备出色的功能和准确性,然而,对于大多数普通用户而言,直接操作它可能仍有一定难度。

因此,我为大家推荐 GitHub 上的一款名为 Buzz 的音频转录和翻译工具。这款工具基于 Whisper 开发,不仅完全开源免费,而且界面设计简洁,操作便捷。通过它,用户可以轻松实现音频或视频中的语音到文本的转换,而且整个过程可以在本地电脑上离线完成。

项目介绍

Buzz 是一款利用 OpenAI 的 Whisper 模型进行离线转录和翻译音频的应用程序。Whisper 是一个由 OpenAI 开发的自动语音识别 (ASR) 模型,专门设计用于处理多种语言的音频数据,包括转录和翻译。Whisper 模型的一个关键特点是它能够在没有网络连接的情况下运行,这意味着 Buzz 可以在用户的个人计算机上离线工作,为用户提供便捷的音频处理服务。

Buzz 的主要功能包括:

  1. 离线转录 :用户可以直接在本地计算机上转录音频文件,无需将数据发送到云端服务器,这提高了数据隐私和安全性。

  2. 多语言翻译 :Buzz 支持多种语言的转录和翻译,这使得它成为一个适用于多种语言环境的强大工具。

  3. 易于使用 :Buzz 提供了一个用户友好的界面,使得即使是对于非技术用户来说,转录和翻译过程也非常直观和简单。

  4. 高度准确 :由于使用了先进的 Whisper 模型,Buzz 能够提供高准确度的转录和翻译结果。

  5. 隐私保护 :由于所有处理都在本地进行,Buzz 可以保护用户的隐私,避免敏感数据通过互联网传输。

Buzz 的应用场景广泛,包括但不限于个人笔记整理、会议记录、教育资料转录、多语种内容创建等。它特别适合那些需要处理大量音频数据,同时又对数据隐私和安全有较高要求的用户。

主要提供了以下功能:
  • 支持实时进行语音转录和翻译(需麦克风)。
  • 支持导入音视频文件(MP3、WAV、MP4 等),并导出逐句或逐字字幕文件(SRT、TXT、VTT)。
同时,为了提升用户的使用体验,Buzz 贴心地提供了多种模型选择,让用户能够根据自己的电脑配置找到最合适的模型。






请到「今天看啥」查看全文