|
Open Assistant: 本地版YORG开放助手系统 GitHubStore · 公众号 · · 1 年前 · |
|
|
通过Whisper模型将YouTube播放列表中的视频转换成高质量文字稿的项目 GitHubStore · 公众号 · · 1 年前 · |
|
|
GPT4 paper assistant: 用GPT-4建立的论文助手机器人项目 GitHubStore · 公众号 · · 1 年前 · |
|
|
Insanely Fast Whisper:98秒的时间内转录5小时 GitHubStore · 公众号 · · 1 年前 · |
|
|
html-to-image:将 HTML 网页转化成图片的库 GitHubStore · 公众号 · · 1 年前 · |
|
|
CareGPT (关怀GPT):医疗LLM,开源驱动,共创健康未来 GitHubStore · 公众号 · · 1 年前 · |
|
|
Umi-OCR V2 文字识别工具 - 开源、免费、实用的离线OCR软件 GitHubStore · 公众号 · · 1 年前 · |
|
|
Distil-Whisper:比Whisper快6倍,体积小50%的语音识别模型 GitHubStore · 公众号 · · 1 年前 · |
|
|
阿里云研发大规模音频语言模型Qwen-Audio GitHubStore · 公众号 · · 1 年前 · |
|
|
Story-to-Motion:根据文本故事内容生成连续的角色的动画 GitHubStore · 公众号 · · 1 年前 · |
|
|
LLaMA-Factory:羊驼工厂,简化大语言模型的微调 GitHubStore · 公众号 · · 1 年前 · |
|
|
开源代码大模型DeepSeek Coder GitHubStore · 公众号 · · 1 年前 · |
|
|
Windrecorder:连续记录屏幕内容,通过OCR技术识别记录内容 GitHubStore · 公众号 · · 1 年前 · |
|
|
MuseScore: 一款开源免费的乐谱软件 GitHubStore · 公众号 · · 1 年前 · |
|
|
基于AI的视频硬字幕去除、水印去除,无损分辨率生成去字幕、去水印后的视频文件 GitHubStore · 公众号 · · 1 年前 · |
|
|
YOLO-NAS Pose:一个开源的实时人体姿态估计模型 GitHubStore · 公众号 · · 1 年前 · |
|
|
MyHeyGen:平民版视频翻译工具,音频翻译,翻译校正,视频唇纹合成全流程解决方案 GitHubStore · 公众号 · · 1 年前 · |
|
|
布朗大学和普林斯顿联合开发Lang2LTL:彻底改变人与机器人之间的交流 GitHubStore · 公众号 · · 1 年前 · |
|
|
MM-Vid:能处理和理解长视频内容并进行问答的视频理解系统 GitHubStore · 公众号 · · 1 年前 · |
|