项目简介
这个小型工具库的初次发布允许您提出在处理视频内容时最常见的问题——视频中是否包含您关心的内容
现在,你可以让 AI 与你一起观看,并使用简单的英语句子自动截取关键时刻的屏幕截图,就像它是你的朋友一样解释你想要的内容
即使更好,这一切都在客户端的网络浏览器中工作,因为我正在使用#WebAI 运行 AI 模型,这意味着一旦网页下载完成,这可以完全离线工作 - 保护您的隐私,并且无需支付昂贵的 API 费用!
此外,由于您正在处理从未上传到云服务器的本地文件,这意味着您甚至可以在硬盘上观看那 100G
你怎么使用它?
由于这是我一天内制作的,所以它不是一个完美的界面,我的重点只是让最小可行产品(MVP)运行起来,因此我欢迎反馈,并且很可能会在未来改进这个产品。不过目前,它非常简单:
在您的 HTML 文件中使用模块脚本包含:
<script type="module" src="YOUR/PATH/TO/doesVideoContain.js">script>
然后在你的 JavaScript(也设置为模块)中:
import {doesVideoContain} from "https://YOUR_PATH_TO/doesVideoContain.js";
const SEARCH_BOX = 'searchbox';
const UPLOADER = 'videoUpload';
const VIDEO_CONTAINER_ELEMENT = 'videoRenderer';
const RESULTS_RENDER_ELEMENT = 'output';
const CONFIG = {
task: '',
videoMuted: false,
videoDisableAutoplay: false,
debugLogs: true,
minSimilarity: 0.35
};
doesVideoContain.init(SEARCH_BOX, UPLOADER, VIDEO_CONTAINER_ELEMENT, RESULTS_RENDER_ELEMENT, CONFIG, loaded);
function loaded() {
}
这怎么可能?
这得益于令人惊叹的 Web AI 生态系统,它将许多流行的 AI 模型带到了网络浏览器。我计划在未来利用更广泛的生态系统来进一步提升这一功能,但最初版本之所以可能,得益于 Transformers.js 和 ONNX Runtime Web 的结合,以及我自己的定制逻辑,用于从 AI 模型生成的嵌入中执行余弦相似性计算,并与各种 DOM 处理/渲染相结合。