专栏名称: GitHubStore
分享有意思的开源项目
目录
相关文章推荐
达州发布  ·  达州上市了!每公斤高达380元! ·  9 小时前  
LRTV辽宁之声  ·  近期大量上市,多人吃进急诊室!紧急提醒→ ·  昨天  
LRTV辽宁之声  ·  近期大量上市,多人吃进急诊室!紧急提醒→ ·  昨天  
福州新闻网  ·  近期大量上市,多人吃进急诊室!紧急提醒→ ·  昨天  
福州新闻网  ·  近期大量上市,多人吃进急诊室!紧急提醒→ ·  昨天  
润农畜牧报价  ·  2025年2月21日 行情向好,小麦继续涨! ·  3 天前  
新疆949交通广播  ·  或致大脑变迟钝!这个小习惯的伤害不可忽视→ ·  3 天前  
51好读  ›  专栏  ›  GitHubStore

号称世界上第一个开源实时翻译的 App

GitHubStore  · 公众号  ·  · 2024-07-01 12:44

正文

项目简介

在「端侧」上实现可离线的「实时同传」翻译,支持 29+ 语言的 RTranslator 开源 一天飙升 1700 Star - 号称世界上第一个开源实时翻译的 App - Onnxruntime 端侧运行,Meta 开源的 SOTA NLLB 跑翻译,Whisper 244M 做 TTS/STT - 3种模式解决快速、长对话、简单文本翻译

连接到拥有该应用程序的人,连接蓝牙耳机,将手机放入口袋中,然后您就可以像对方说您的语言一样进行对话。


对话模式

对话模式是RTranslator的主要功能。在此模式下,您可以与使用此应用程序的另一部手机连接。如果用户接受您的连接请求:

  • 当您说话时,您的手机(或蓝牙耳机,如果已连接)将捕获音频。

  • 捕获的音频将转换为文本并发送到对话者的手机上。

  • 对话者的手机会将收到的文本翻译成他的语言。

  • 对话者的手机会将翻译后的文本转换为音频,并从扬声器中再现它(或者通过对话者的蓝牙耳机,如果连接到他的手机)。


所有这一切都是双向的。

每个用户可以拥有多个已连接的电话,以便您可以翻译两个以上的人之间以及任意组合的对话。


对讲机模式

如果对话模式适用于与某人进行长时间对话,那么该模式则专为快速对话而设计,例如在街上询问信息或与店员交谈。

该模式只能翻译两个人之间的对话,不适用于蓝牙耳机,而且必须轮流说话。这不是真正的同声翻译,但它只能在一部手机上使用。

在此模式下,智能手机麦克风将同时以两种语言收听(可在对讲机模式的同一屏幕中选择)。

该应用程序将检测对话者使用哪种语言,将音频翻译成另一种语言,将文本转换为音频,然后从手机扬声器中再现。TTS 结束后,它将自动恢复收听。



文本翻译模式

这种模式只是一个经典的文本翻译器,但总是有用的。

一般的

RTranslator 使用 Meta 的 NLLB 进行翻译,使用 OpenAi 的 Whisper 进行语音识别,两者都是(几乎)开源且最先进的 AI,具有出色的质量并直接在手机上运行,确保绝对隐私,甚至可以在离线状态下使用 RTranslator。质量损失。

此外,RTranslator 甚至可以在后台运行、手机处于待机状态或使用其他应用程序时(仅当您使用对话或 WalkieTalkie 模式时)。然而,有些手机会限制后台的电量,因此在这种情况下,最好避免它并在屏幕打开的情况下保持应用程序打开。


项目链接

https://github.com/niedev/RTranslator







请到「今天看啥」查看全文