【初学者必看】图像处理入门,Blob分析技术

新单词

OCR(Optical Character Recognition,光学字符识别)
Skew 斜率
Spacing 间距
ROI(region of interest),感兴趣区域
查找表(Look-Up-Table)web

Blob

翻译成中文,是“一滴”,“一抹”,“一团”,“弄脏”,“弄错”的意思。在计算机视觉中的Blob是指图像中的具备类似颜色、纹理等特征所组成的一块连通区域。显然,Blob分析其实就是将图像进行二值化,分割获得前景和背景,而后进行连通区域检测,从而获得Blob快的过程。简单来讲,blob分析就是在一块“光滑”区域内,将出现“灰度突变”的小区域寻找出来。举例来讲,假如如今有一块刚生产出来的玻璃,表面很是光滑,平整。若是这块玻璃上面没有瑕疵,那么,咱们是检测不到“灰度突变”的;相反,若是在玻璃生产线上,因为种种缘由,形成了玻璃上面有一个凸起的小泡、有一块黑斑、有一点裂缝。。。那么,咱们就能在这块玻璃上面检测到纹理,颜色发生突变的部分,而这些部分,就是生产过程当中形成的瑕疵,而这个过程,就是blob分析。显然,纺织品的瑕疵检测,玻璃的瑕疵检测,机械零件表面缺陷检测,可乐瓶缺陷检测,药品胶囊缺陷检测等不少场合都会用到blob分析。算法

Introduction 介绍

 前景/背景分割完成后,在大多数应用程序中,下一个任务是分析单个前景对象,以得到对所观察场景的某种高级知识。
 这种知识可能涉及检测什么类型的对象包含在场景,测量他们的位置和姿态,评估对象是否显示或不制造缺陷或错误…
 所以,单个对象(一般称为blob(二进制大型对象)或区域,首先须要在整个前台区域内进行隔离。正如已经指出的,这个步骤被称为链接组件标记。
 而后,能够对单个对象进行处理,以提取与所需的高级知识相关的特定特性。例如,能够经过计算几个特征来肯定物体的形状,从而检测在观察到的场景中是否存在一个或多个由机器人拾取的特定类型的物体。要让机器人选择被探测到的物体,一般须要计算与它们的位置和方向相关的其余特征。
 从Blob中提取特征的过程一般称为Blob分析。特征能够来自属于blob(区域特征)的全部像素,也能够来自边界像素(边界或轮廓特征)。文献中已经提出了大量不一样的特性:咱们将在这里介绍一些最普遍使用的特性。
 与形状相关的特性须要显示对象图像在指定设置中可能经历的转换的不变性。大多数状况下,形状特征须要知足类似变换(平移、旋转和缩放变化)的不变性,也就是说,若是对象出如今不一样的位置或旋转或在图像中显示不一样的大小,则不须要改变。
 •基于blob特性的对象检测能够根据启发式规则或部署模式识别技术来完成,例如特殊的机器学习技术。利用后一种方法,从训练样本中学习了将特征向量映射到一组对象类型的分类函数。app

举个栗子

•从Blob中提取特征的过程一般称为Blob分析。特征能够来自属于blob(区域特征)的全部像素,也能够来自边界像素(边界或轮廓特征)。文献中已经提出了大量不一样的特性:咱们将在这里介绍一些最普遍使用的特性。
•与形状相关的特征第一个扫描前景像素基于那些已经访问过的邻居,这取决于选择的距离,如D4,和扫描顺序,如左右,自上而下。
•在第一次扫描时,不一样的blob显然已经被赋予了不一样的标签,不过,根据形状的不一样,这可能也适用于单个blob的链接部分。
•所以,第二次扫描容许将惟一的最终标签分配给属于同一个blob的部分,这些部分在第一次扫描时被分配了不一样的临时标签。
•有意地,在两次扫描之间须要找到等效的临时标签,以便为临时标签之间的每一个等价类分配惟一的最终标签。须要显示对象图像在指定设置中可能经历的转换的不变性。大多数状况下,形状特征须要知足类似变换(平移、旋转和缩放变化)的不变性,也就是说,若是对象出如今不一样的位置或旋转或在图像中显示不一样的大小,则不须要改变。
•基于blob特性的对象检测能够根据启发式规则或部署模式识别技术来完成,例如特殊的机器学习技术。利用后一种方法,从训练样本中学习了将特征向量映射到一组对象类型的分类函数。机器学习

文本分析技术Example: Text Analysis

质量控制和OCR(Optical Character Recognition,光学字符识别)
Grab image ROI Binarization Labeling Blob Analysissvg

距离和连通性Distances and Connectivity

为了讨论标记二值图像连通份量的算法,首先咱们须要引入连通性的概念,它又与离散平面上的距离E2有关
距离的定义:非负性,零和性,交换性,三角形定理
City-block distance
4-neighbourhood of p n4§
二进制图像的连通份量 Connected Components of a Binary Image函数

Connected Components Labeling 联通区域标记

属于不一样链接组件的像素被赋予不一样标签,而背景像素不受影响的计算(例如
他们能够保留之前的标签,或者,等价地,一个新的标签)
经典2扫描算法肯定联通份量The classical 2-scans algorithm
经过第一次扫描前景像素采起临时标签,这取决于选择的距离,以及扫描顺序,如左,右,自上而下。在第一次扫描时,不一样的团块固然被赋予了不一样的标签,根据形状的不一样,这可能同一联通区域赋予了不一样的值。第二次扫描惟一的最终标签分配给连通份量。在两次扫描之间须要找到等价的临时标签,以便为临时标签之间的每一个等价类分配一个唯一的最终标签。学习

Flood-fill approach 洪水填充算法

这种方法实现起来很是简单,但因为图像被扫描了几回而不是两次,效率明显较低。从“种子”像素开始,新标签将在链接的组件中传播。传播一般是经过迭代过程进行的,其中图像是交替处理的自顶向下的左右和自底向上的左边/右边扫描。翻译