专栏名称: 产业智能官
用新一代技术+商业操作系统(AI-CPS OS:云计算+大数据+物联网+区块链+人工智能),在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的认知计算和机器智能;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。
目录
相关文章推荐
旁门左道PPT  ·  领导:一张图别加,把这套PPT弄高级!! ·  19 小时前  
小米汽车  ·  #小米SU7Ultra# ... ·  20 小时前  
小米汽车  ·  Xiaomi ... ·  23 小时前  
小米汽车  ·  Xiaomi ... ·  昨天  
小米汽车  ·  #小米SU7# 1.5.5 ... ·  昨天  
51好读  ›  专栏  ›  产业智能官

【机器视觉】机器视觉全面解析

产业智能官  · 公众号  ·  · 2018-11-13 06:28

正文

随着工业4.0时代的到来,机器视觉在智能制造业领域的作用越来越重要,为了能让更多用户获取机器视觉的相关基础知识,包括机器视觉技术是如何工作的、它为什么是实现流程自动化和质量改进的正确选择等。小编为你准备了这篇机器视觉的干货资料。


随着 工业4.0 时代的到来, 机器视觉 在智能制造业领域的作用越来越重要,为了能让更多用户获取机器视觉的相关基础知识,包括机器视觉技术是如何工作的、它为什么是实现流程 自动化 和质量改进的正确选择等。小编为你准备了这篇机器视觉的干货资料。



什么是机器视觉?

我们先从机器视觉的定义开始,根据制造工程师协会的定义:机器视觉就是使用光学非接触式感应设备自动接收并解释真实场景的图像以获得信息控制机器或流程。


那么,这到底是什么意思呢? 简单来说,机器视觉就是为了流程控制或检测所制造的产品而从数字图像中自动提取信息,看下图示范:

机器视觉运用图解


为了更好地理解机器视觉,下面,我们以啤酒厂采用的填充液位检测系统为例来进行说明:

图1 啤酒瓶填充液位检验示例


当每个啤酒瓶移动经过检测传感器时,检测传感器将会触发视觉系统发出频闪光,拍下啤酒瓶的照片。采集到啤酒瓶的图像并将图像保存到内存后,视觉软件将会处理或分析该图像,并根据啤酒瓶的实际填充液位发出通过-未通过响应。如果视觉系统检测到一个啤酒瓶未填充到位,即未通过检测,视觉系统将会向转向器发出信号,将该啤酒瓶从生产线上剔除。操作员可以在显示屏上查看被剔除的啤酒瓶和持续的流程统计数据。


另外,机器视觉系统还能够进行物品测量,比如确定火花塞间隙或提供位置信息,引导 机器人 在制造组装过程中将元件对位,图2显示的例子主要是说明机器视觉系统如何能够用于进行滤油器(右)通过或未通过检测,以及测量支架上中心轴头的宽度(左)。

图2 机器视觉系统能够在生产线上进行实时测量和检验,比如加工支架(左)或滤油器(右)


在这个应用示例中,填充液位检验系统仅可提供两种结果,这显示了二进制系统的特征:


1、如果产品合格,则检测结果为“通过”

2、如果产品不合格,则检测结果为“未通过”。


机器视觉的优势究竟有哪些?

虽然人类视觉最擅长于对复杂、非结构化的场景进行定性解释,但机器视觉则凭借速度、精度和可重复性等优势,擅长于对结构化场景进行定量测量,举例来说,在生产线上,机器视觉系统每分钟能够对数百个甚至数千个元件进行检测。配备适当分辨率的相机和光学元件后,机器视觉系统能够轻松检验小到人眼无法看到的物品细节特征。


另外,由于消除了检验系统与被检验元件之间的直接接触,机器视觉还能够防止元件损坏,也避免了机械部件磨损的维护时间和成本投入。通过减少制造过程中的人工参与,机器视觉还带来了额外的安全性和操作优势。此外,机器视觉还能够防止洁净室受到人为污染,也能让工人免受危险环境的威胁。


机器视觉在实现战略目标过程中的重要作用

机器视觉的应用领域


  • 识别

标准一维码、二维码的解码

光学字符识别(OCR)和确认(OCV)


  • 检测

色彩和瑕疵检测

零件或部件的有无检测

目标位置和方向检测


  • 测量

尺寸和容量检测

预设标记的测量,如孔位到孔位的距离

机械手引导

输出空间坐标引导机械手精确定位

机器视觉系统的分类

智能相机

基于嵌入式

基于PC

机器视觉系统的组成

图像获取:光源、镜头、相机、采集卡、机械平台

图像处理与分析: 工控 主机、图像处理分析软件、图形交互界面。

判决执行:电传单元、机械单元

光源种类


LED:寿命长/可以有各种颜色/便于做成各种复杂形状/光均匀稳定/可以闪光;

荧光灯:光场均匀/价格便宜/亮度较LED高;

卤素灯:亮度特别高/通过光纤传输后可做成;

氙灯:使用寿命约1000小时/亮度高,色温与日光接近。

(大部分机器视觉照明采用LED)


光源:光路原理

照相机并不能看见物体,而是看见从物体表面反射过来的光。

镜面反射:平滑表面以对顶角反射光线

漫射反射:粗糙表面会从各个方向漫射光线

发散反射:多数表面既有纹理,又有平滑表面,会对光线进行发散反射


光源:作用和要求


  • 在机器视觉中的作用


  • 照亮目标,提高亮度

  • 形成有利于图像处理的效果

  • 克服环境光照影响,保证图像稳定性

  • 用作测量的工具或参照


  • 良好的光场设计要求


  • 对比度明显,目标与背景的边界清晰

  • 背景尽量淡化而且均匀,不干扰图像处理

  • 与颜色有关的还需要颜色真实,亮度适中,不过曝或欠曝;


光源:光场构造

明场: 光线反射进入照相机

暗场:光线反射离开照相机

光源:构造光源

使用不同照明技术对被测目标会产生不同的影响,以滚珠轴承为例:

镜头: 主要参数

工业的镜头大都是多组镜片组合在一起的。计算时会忽略厚度对透镜的影响将其等效成没有厚度的播透镜模型,即理想凸透镜。

参数:焦距/视场/物距/像距/光圈/景深/分辨力/放大倍数/畸变/接口


分辨率:对色彩和纹理的分辨能力。

畸变:镜头中心区域和四周区域的放大倍数不相同。

畸变的校正一般用黑白分明的方格图像来进行,过程并不复杂。一般如果畸变小于2%,人眼观察不到;若畸变小于CCD的一个像素,摄像机也看不见。

镜头:分类

CCTV镜头

专业摄影镜头

远心镜头

镜头:远心镜头

在测量系统中,物距常发生变化,从而使像高发生变化,所以测得的物体尺寸也发生变化,即产生了测量误差;

即使物距是固定的,也会因为CCD敏感表面不易精确调整在像平面上,同样也会产生测量误差。

采用远心物镜中的像方远心物镜可以消除物距变化带来的测量误差,而物方远心物镜则可以消除CCD位置不准带来的测量误差。

相机

种类:线&面、隔/逐、黑/彩、数/模、低/高、CCD/CMOS

指标:象元尺寸、分辨率、靶面大小、感应曲线、动态范围、灵敏度、速度噪声、填充因子、体积、质量、工作环境等

工作模式:Free run、Trigger(多种)、长时间曝光等

传输方式:GIGE,Cameralinker,模拟



国内计算机视觉算法初创公司大盘点


通过总结我们可以发现,这些初创都有很强的背景,不论是团队背景还是技术能力,并且大多是以人工智能下的视觉处理技术为核心打造各自的算法体系和数据平台。


【商汤科技】

https://www.sensetime.com

商汤科技成立于2014年,主要业务是计算机视觉技术以及深度学习算法,是计算机视觉和深度学习领域的算法提供商。2018年9月初,软银中国的10亿美元投资,将商汤估值抬至60亿美元。


图1 商汤科技生态象限


商汤科技的核心团队由两大部分组成,一部分是来自各大名校的博士、硕士等顶尖行业人才,有150多位人工智能深度学习方向的博士,另一部分则是来自微软、谷歌等相关领域的从业者;核心技术上,主攻人脸识别、视频监控识别算法、增强现实、文字识别、自动驾驶识别算法、医疗影像识别算法几项技术;行业方面,专注于安防监控、金融、手机、移动互联网和深度学习芯片五大领域。

在具体的安防落地案例中,与公安系统合作居多。广州市某公安局使用商汤视图情报研判系统,用以图搜图的检索功能进行案发现场人脸截图与标准库照片比对,进行人员的身份查询,打击已发生的犯罪。2017年以来,视频侦查部门成功比中嫌疑人2000多人,抓获800多人,成功破案近百宗。

营收方面,商汤科技已经实现连续3年间业务年化增长超过400%,2017年已实现全面盈利,营收相比2016年增长420%。其目前的营收来源的四个方向:安防、汽车、手机以及新型业务,智能安防的收入占比最大,占整体营收的30%。此外,60%来自于智能汽车、手机移动互联网方面,剩下10%来自于新型业务。新型业务中,包括了遥感、机器人、视频等业务。

【旷视科技】

https://www.megvii.com

旷视科技成立于2011年,是一家专注于图像识别和深度学习的技术与产品研发的公司,以“Face++”被外界熟知。目前已经完成十几亿美元的融资,最新估值已达30亿美元。


图2 旷世科技生态象限

2014年下半年,旷视成立安防事业部,2015年,旷视决定大力进军安防。2016年从互联网金融切入开始场景落地,并逐渐扩大到安防、手机、新零售、机器人、行业物联等行业。

在金融安全领域,旷视科技已经完成了全球数亿人的远程实名制验证,其智能安防系列解决方案已在全国数十个个省市上线并被中国公安部列入重点技术推广目录。早在2015年,旷视科技就发布了一款面向To B市场的智能安防摄像机——MegEyeC1,该系列已经发展到了MegEye-C3S版本,MegEye-C3S可实现全帧率、全画幅的人脸实时检测与抓拍,单帧可实现100张以上人脸检测与抓拍,特别适用于人流密集的通道、出入口等场景,实现对人群中人脸信息的精准捕捉。

图3 端到端智能安防产品及解决方案架构


【云从科技】

http://www.cloudwalk.cn

云从科技成立于2015年,孵化于中科院重庆研究院,专注于计算机视觉与人工智能等技术的研发,具有国家队背景。其成立的目的是重点转化人脸识别技术、人群监测技术、警用图侦技术和交通识别技术等科研成果。目前三大业务线包括金融、安防及创新,产品覆盖银行、安防、民航等领域,是国内银行业人脸识别的第一大供应商。

图4 云从科技生态象限

在人脸识别应用方面,以银行业为例,国内有能力自建系统的银行为148家。截至2018年3月15日,已完成招标的银行为121家,其中,云从中标88家总行平台,市场占有率为72.7%。

今年3月,云从科技发布的“炬眼”智能识别相机,被称为是世界科技界的一项重大突破。“炬眼”智能人脸识别相机使用Intel架构,在摄像机本地完成全程识别,极速传输识别结果到后台,准确率高达99.8%以上,目前相关产品已在23个省上线实战。

【云天励飞】

http://www.intellif.com

云天厉飞成立于2014年8月,是一家专注于视觉人工智能领域的公司,致力于打造基于视觉芯片、深度学习和大数据技术的“视觉智能加速平台”,为平安城市、智慧商业、工业智造、无人系统、机器人等行业的千家企业提供视觉智能应用解决方案和开发平台。


图5 云天厉飞生态象限

2015年,云天励飞打造了一个基于前端抓拍和云端搜索的人像智能系统;2016年,成功为2016杭州g20峰会西湖核心区域提供动态人像识别安保服务;2017年1月,在云天励飞的帮助下,深圳市公安局在15个小时内就破获一起拐卖儿童案件。

基于云天【深目】人像智能平台,云天励飞目前在深圳市范围内已经部署了5000多路的在线智能前端设备,全部动态人像的数据量也接近150亿张。而云天【深目】动态人像智能平台已在北京、上海、广州、杭州、新疆等先后落地,并进入新加坡、马来西亚等国家。

【依图科技】

http://www.yitutech.com

依图科技成立于2012年,致力于人工智能的研发工作。其计算机视觉技术目前主要应用在安防、金融以及医疗领域三大领域。在安防领域,公司研发的“蜻蜓眼”人像大平台已服务全国上百个地市公安系统,是全国唯一拥有十亿级人像库比对能力的公司;在金融领域,截止2015年,招商银行 1500 多个网点接入了依图系统,刷脸取款技术已经应用于全国2万多台ATM机。


图6 依图科技生态象限

蜻蜓眼智能安防产品包括人像大平台、车辆大平台两大系列。其中人像大平台采用依图自主研发的人脸识别技术,可进行基于图片的静态人脸比对,和基于视频流、图片流的动态人像识别及比对。系统广泛支持x86、GPU架构;提供了完善,可定制的用户体系,授权机制,权限系统和监管能力;支持跨集群协同联动;针对不同应用场景,提供了一体机,便携式单兵工具等多种产品形态。

图7 依图科技蜻蜓眼人像大平台特点


【神目科技】

https://www.deepcam.cn

神目科技是一家计算机视觉公司,成立于2016年12月,是一家以客户为导向的公司,主要以人脸识别、姿态识别、物体识别等核心算法在安防、零售以及移动手机端落地服务。

图8 神目科技生态象限

目前落地比较好的是智能终端,比如手机端。而在安防领域,其人脸识别系统几乎每天可以协助公安人员抓捕一名嫌犯。在智慧零售方面以防止偷盗为主要目的,其市场目前分为国内和海外两块,产品在美国本土应用的店铺超过了2000家,包括知名的零售企业7-11,还有一些体育用品零售店等;在国内合作的零售店铺也已经达到了100多家,其中包括万科、万达、良品铺子连锁店等。

【深醒科技】

https://www.sensingtech.com.cn

深醒科技成立于2016年1月,是一家从事人工智能方向,集研发、生产和销售为一体的高科技公司,以人脸识别技术切入AI战场,目前专注在安防领域人脸识别方向。

图10 深醒科技生态象限

2017年12月,BBC 曾对深醒科技在贵阳公安局安装的“深醒动态人脸识别实时预警系统”进行了一次实地测试。BBC记者逃犯,试图逃离贵阳市。在照片被技术人员录入数据库中后,其所到之处,但凡有摄像头的地方,都会被抓拍到身影。

而其被抓拍到的面部画像、出现位置及时间都实时的出现在了贵阳公安局数控大厅的屏幕上。最终,这名记着仅逃跑了7分钟就被贵阳警察在火车站大厅中“抓获”。

深醒科技在人脸识别的技术方面不仅采用静态算法,同时采用动态识别技术,并且其红外人像识别技术突破了黑暗背景下的人脸识别难题,在阴天、夜晚等低光照条件下仍有较高的识别率。目前其主要客户包括新疆、青海、云、贵、川、黑龙江等省份的公安系统,中航工业、中石油、中铁等大型企业、部分国内商业大厦和商业银行。

【眼神科技】

http://www.eyecool.cn

眼神科技成立于2016年,是一家专注于生物识别技术开发和应用的公司。现已开发完毕并投入使用的生物识别技术包括指纹、人脸和虹膜识别技术,正在研发中的有指静脉识别技术。

图11 眼神科技生态象限

眼神科技的产品当前主要应用在金融、公安、社保、校园、社区等方面。在人脸识别技术方面,眼神已经将其大规模产品化并应用于几十家银行,其算法在LFW人脸识别大赛中准确率达到了99.71%。

目前,眼神科技已经在全国20多个机场和客运站上线了安全管控系统,能够实现动态人脸识别,人、证、票合一检验,重点人员的布控和预警,满足了治安管理、通行管理、报警、门禁等各方面需求。







请到「今天看啥」查看全文