专栏名称: OpenCV学堂
一个致力于计算机视觉OpenCV原创技术传播的公众号!OpenCV计算机视觉与tensorflow深度学习相关算法原创文章分享、函数使用技巧、源码分析与讨论、,计算机视觉前沿技术介绍,技术专家经验分享,人才交流,学习交流。
目录
相关文章推荐
信息时报  ·  男子上班3天被辞退,7天后公司没了!法院判了 ·  20 小时前  
信息时报  ·  男子上班3天被辞退,7天后公司没了!法院判了 ·  20 小时前  
华商报  ·  “上厕所都盯着!” ... ·  3 天前  
海伦融媒  ·  一生要出片的朋友圈呀,哪些照片不能晒? ·  3 天前  
51好读  ›  专栏  ›  OpenCV学堂

OpenVINO2024+QT5自动水印移除系统

OpenCV学堂  · 公众号  ·  · 2024-07-27 21:30

正文

点击上方 蓝字 关注我们

微信公众号: OpenCV学堂

关注获取更多计算机视觉与深度学习知识

修复模型介绍

在 OpenVINO2024 的公开模型库中有一个图象修复的模型的,它支持使用mask作为参考,实现对输入的修复。模型来自:

https://github.com/shepnerd/inpainting_gmcnn.git

模型结果如下:


下载模型之后,通过OpenVINO的脚本支持一键转换为IR格式。 下载命令行:

python downloader.py --name gmcnn-places2-tf

转换命令行:

python converter.py --name gmcnn-places2-tf


转换之后的模型输入格式如下:

Placeholder - [BCHW] = 1x3x512x680 BGR, 图象Placeholder_1 - [BCHW] = 1x1x512x680 mask 单通道二值图象


输出格式如下:

1x3x512x680 BGR, 图象

场景文字检测模型

OpenVINO支持的场景文字检测是基于PixelLink模型,该模型是浙大联合阿里提出,其核心思想是基于图像分割来实现场景文字检测

比起之前的很多基于检测的场景文字检测模型来说在性能与准确率方面都有比较明显的提升。PixelLink网络模型架构如下:

其中CNN部分采用了VGG16做为特征提取网络,对输出分为两个部分

  • 像素分割,判断每个像素是否为text/non-text

  • 链接预测,对每个像素点八领域进行链接预测,如果是positive则合并为text像素,如果不是则放弃。

通过上述两步之后得到叠加的TEXT图像mask,对mask图像进行连通组件发现或者基于OpenCV的轮廓发现即可得到最终检测框输出。检测框输出分为两种

  • 基于minAreaRect

  • 基于boundingRect

水印自动移除

使用转换之后的模型,基于场景文字检测得到mask,然后基于图像inpaint模型完成修复,就实现了自动去水印。运行结果如下:


OpenVINO2024 + QT5 应用构建与演示如下:




OpenCV4系统化学习


深度学习系统化学习

推荐阅读

OpenCV4.8+YOLOv8对象检测C++推理演示







请到「今天看啥」查看全文