【图像处理】数字图像处理中经常使用图像分割算法(理论初识)

(1)基于阈值的分割方法:可在各类颜色空间或不一样通道中完成阈值、自适应阈值、
(2)基于边缘的分割方法:各类边缘检测算子
(3)基于区域的分割方法:分水岭、区域归并与分裂
(4)图割分割:最大流(最小割)算法
(5)基于深度信息的分割:

(6)基于先验信息的分割:算法


我的认为图像分割的算法能够从分割目标入手:一般是要将图像分红目标区域和背景。须要从图像的特征入手,以灰度图像为例(其他类型的图像处理均相似),图像图形很明显的特征有:图像灰度值特征、目标边界特征、纹理特征、形态学特征等等;还有一些基于这些特征所计算提取出的特征,好比信息熵、能量泛函等等。框架

最为简单的就是灰度值特征了,一幅图中有时候目标区域与背景区域有很明显的亮度区别,基于这个认识,只要试图找到某个亮度的值,咱们假设低于该值的认为是背景,高于该值的认为是目标。关于找这个值的算法就是阈值分割算法了,像OTSU、迭代法、最大熵法等等都是属于这一范畴。dom

同时也能够注意到,在空域内,目标的边界是区分目标与背景的重要依据,所以区分边界也是一个重要的手段,一般边界点周围灰度值变化率很高,所以能够基于图像灰度梯度来识别。这就有一些sobel算子、canny算子等等方式,都是经过找到边界来肯定目标区域与背景的。函数

在有些图像中,目标区域具备必定的连续性,基于区域连续性的一些方法像区域生长法、分水岭算法等(本人对这一块不是很熟悉)。性能

另外,基于图像原始的特征进行提取得到“精炼”的二级特征,并据此分割也是一种好的方法。像SNAKE算法,该算法认为目标区域的边界是“外力”,内力共同做用的结果,所以当外力内力平衡时找到边界,基于这种平衡,提出了判断能量泛函最小的判断原则。此外,还有基于几何活动轮廓模型的水平集方法,该方法是借助于目标区域的几何度量参数,能够比较好的处理一些拓扑变化。学习


这里主要简单介绍几类经典的方法:优化


基于边缘检测的方法
基于边缘检测的方法主要是经过检测出区域的边缘来进行分割,利用区域之间特征的不一致性,首先检测图像中的边缘点,而后按必定策略链接成闭合的曲线,从而构成分割区域图像中的边缘一般是灰度、颜色或纹理等性质不连续的地方。对于边缘的检测,常常须要借助边缘检测算子来进行,其中经常使用的边缘检测算子包括[3]:Roberts 算子、Laplace 算子、Prewitt 算子、Sobel 算子、Rosonfeld算子、Kirsch 算子以及Canny 算子等。
边缘检测算法比较适合边缘灰度值过渡比较显著且噪声较小的简单图像的分割。对于边缘比较复杂以及存在较强噪声的图像,则面临抗噪性和检测精度的矛盾。若提升检测精度,则噪声产生的伪边缘会致使不合理的轮廓:若提升抗噪性,则会产生轮廓漏检和位置误差[4]。
spa


阈值分割方法
阈值分割是最古老的分割技术,也是最简单实用的。许多状况下,图像中目标区域与背景区域或者说不一样区域之间其灰度值存在差别,此时能够将灰度的均一性做为依据进行分割[3]。阈值分割即经过一个或几个阈值将图像分割成不一样的区域。阈值分割方法的核心在于如何寻找适当的阈值。最经常使用的阈值方法是基于灰度直方图的方法,如最大类间方差法(OTSU)[5]、最小偏差法、最大熵法等。此类方法一般对整幅图像使用固定的全局阈值,若是图像中有阴影或亮度分布不均等现象,分割效果会受到影响。基于局部阈值的分割方法对图像中的不一样区域采用不一样的阈值,相对于全局阈值方法具备更好的分割效果[6],该方法又称为自适应阈值方法。其中阈值的选取通常是基于图像的局部统计信息,如局部方差[7]、局部对比度[8]以及曲面拟合阈值[9]等。不管是基于全局阈值仍是局部阈值,阈值方法一般受噪声影响较大。为了获得较好的分割结果,一般还须要与其余图像处理技术,如图像去噪等相结合。
.net



基于聚类的分割方法
聚类分析是多元统计分析的方法之一,也是模式识别中非监督模式识别的一个重要分支。根据数据集合的内部结构将其分红不一样的类别,使得同一类内样本的特征尽量类似,而属于不一样类别的样本点的差别尽量大。聚类分析技术大体上可分为硬聚类、模糊聚类与可能性聚类方法[10]。
设计

硬聚类方法中,样本点归属于不一样类别的隶属度函数取值为0 或1,即每一个样本只可能属于某一特定的类别。传统的硬聚类方法包括k 均值聚类[11]以及ISODATA[12等。模糊聚类方法是一种基于目标函数迭代优化的无监督聚类方法,样本点的隶属度函数取值为区间[0, 1],同时每一个样本点对各种的隶属度之和为1,即认为样本点对每一个聚类均有一个隶属度关系,容许样本点以不一样的模糊隶属度函数同时归属于全部聚类。模糊聚类方法的软性划分,真实地反映了图像的模糊性和不肯定性,所以其性能优于传统的硬分割方法。目前模糊聚类方法已经普遍应用于图像处理特别是医学图像处理中,其中最经常使用的是模糊C 均值聚类方法(FCM)[13,14]。可能性聚类样本点的隶属度函数一样取值为区间[0, 1],但其不要求隶属度之和为1。可能性聚类不只顾及到样本与聚类中心的隶属度关系,同时考虑了样本的典型性对分类结果的影响。 传统的聚类算法没有考虑图像的空间信息,所以其对噪声与灰度分布不均很是敏感。为提升模糊聚类算法在图像分割中的效果,国内外学者提出了不少改进方法,其中结合空间信息是最多见的方法[15--24]。


活动轮廓方法

活动轮廓方法(又称为Snake 模型)是Kass等人[25]于1987 年提出的,活动轮廓即定义在图像域的曲线或者曲面,在与自身几何特性相关的内力以及图像数据相关的外力共同做用下,以最小化能量函数的形式向边界运动。通过二十多年的发展,活动轮廓模型已经在边缘检测、图像分割以及运动跟踪中获得了普遍的应用[26,27]。

按照曲线的表达方式的不一样,活动轮廓模型大体能够分为两大类:参数活动轮廓模型和几何活动轮廓模型。参数活动轮廓模型采用参数化的形式直接描述活动轮廓曲线,轮廓曲线由一些规则排列的不连续的点(也称snaxels) 组成或经过一些基函数将其描述成一种连续的参数形式。因为参数活动轮廓方法都是显式的表示曲线,所以便于引入先验形状约束[28],同时有利于人机交互[27]。其缺点在于不能自适应的改变曲线的拓扑结构,难以处理曲线的分裂与合并;同时做为一种局部性方法,其最终分割结果严重依赖于初始位置。此外,轮廓曲线在演化过程当中很难精确模拟复杂的边界,如深度凹陷的边界。Xu等人[29]提出梯度矢量流(GVF)Snake 方法,利用梯度矢量流来代替传统外力场,因为GVF 的做用范围比传统的Snake 模型大,可以促使轮廓曲线进入目标物体的凹陷部分,所以其在必定程度上克服了参数活动轮廓方法易于陷入局部能量极小的缺陷。


几何活动轮廓模型以曲线演化理论以及水平集方法为基础,曲线的演化仅依赖于其内在几何特性,而独立于曲线的参数。因为采用水平集方法隐式的表示曲线,使得其可以灵活地处理曲线的拓扑变化。几何活动轮廓模型又可分为基于边界的活动轮廓模型、基于区域的活动轮廓模型。基于边界的活动轮廓模型主要依赖图像的边缘信息控制曲线的运动速度。在图像边缘强度较弱或是远离边缘的地方,轮廓曲线运动速度较大,而在图像边缘强度较强的地方,轮廓曲线运动速度较小甚至中止,使得最终的轮廓曲线运动到边缘位置。比较著名的模型包括Caselles[30]提出的基于平均曲率流的几何活动轮廓模型、Caselles 与Kimmel 等人[31]提出的测地线活动轮廓方法。基于边界的活动轮廓方法对于对比度较好的图像具备较好的分割效果,然而,因为轮廓曲线的演化依赖于图像的边缘信息,当图像中噪声较强时一般难以获得理想的分割效果。基于区域的活动轮廓方法最先是由Mumford 与Shah 提出的MS 模型[32],其主要思想是用分片光滑的函数逼近原始图像,经过能量泛函的极小化寻找合适的轮廓曲线以及近似函数,使得近似函数在除去轮廓曲线之外的同质区域为光滑函数。尽管已经有二十多年的历史,MS 模型至今仍然具备强大的生命力,基于MS 模型的分割方法依然层出不穷。因为MS 模型数值求解存在较大困难,其近似求解算法也是研究的热点问题。目前关于MS 模型的近似方法主要包含两类方法:Ambrosio 提出的基于椭圆逼近的辅助变量模型[33--36]以及Chan 与Vese 提出的基于简化MS 模型与水平集方法相结合的方法[37]。Zhu 等人提出的区域竞争的活动轮廓模型,将区域增加、活动轮廓以及基于Bayes 公式和最小描述长度(MDL)的多相分割方法统一块儿来。区域竞争法拥有这三种方法的优势,互相弥补了他们的不足之处。此外,测地线活动区域模型[38](Geodesic Active Region)结合了基于边界与基于区域的活动轮廓方法,可以有效利用图像的边缘信息与区域信息。近年来,为处理灰度分布不均图像的分割问题,提出了许多局部化的活动轮廓模型,如Li Chunming 等人[39]提出的基于局部二进拟合能量的活动轮廓模型(LBF)


基于图论的方法

基于图论的图像分割技术是近年来图像分割领域的一个新的研究热点。其基本思想是将图像映射为带权无向图,把像素视做节点,节点之间的边的权重对应于两个像素间的不类似性度量,割的容量对应能量函数。运用最大流/最小算法对图进行切割,获得的最小割对应于待提取的目标边界。该方法具备快速、鲁棒、全局最优、抗噪性强、可扩展性好等优势。目前,基于图论的图像分割方法的研究主要集中在如下几个方面[40]:

(1) 最优剪切准则的设计;

(2) 谱方法用于分割;

(3) 快速算法的设计等。

基于图论的方法本质上将图像分割问题转化为最优化问题,是一种点对聚类方法,其最优分割基本原则就是使划分红的两个子图(区域) 内部类似度最大,而子图之间的类似度最小。图割算法中割集准则的好坏直接影响到最终分割结果,其中常见的割集准则包括:Minimum cut[41]、Average cut[42]、Normalizecut[43]、Min—max Cut[44]以及Ratio cut[45]等。



区域生长与分水岭算法
区域生长方法[46]也是一种经常使用的区域分割技术,其基本思路是首先定义一个生长准则,而后在每一个分割区域内寻找一个种子像素,经过对图像进行扫描,依次在种子点周围邻域内寻找知足生长准则的像素并将其合并到种子所在的区域,而后再检查该区域的所有相邻点,并把知足生长准则的点合并到该区域,不断重复该过程直到找不到知足条件的像素为止。该方法的关键在于种子点的位置、生长准则和生长顺序。分水岭算法[47,48]是以数学形态学做为基础的一种区域分割方法。其基本思想是将梯度图像当作是假想的地形表面,每一个像素的梯度值表示该点的海拔高度。原图中的平坦区域梯度较小,构成盆地,边界处梯度较大构成分割盆地的山脊。分水岭算法模拟水的渗入过程,假设水从最低洼的地方渗入,随着水位上升,较小的山脊被淹没,而在较高的山脊上筑起水坝,防止两区域合并。当水位达到最高山脊时,算法结束,每个孤立的积水盆地构成一个分割区域。因为受到图像噪声和目标区域内部的细节信息等因素影响,使用分水岭算法一般会产生过度割现象,分水岭算法通常是做为一种预分割方法,与其它分割方法结合使用,以提升算法的效率或精度,如文献[49]使用分水岭算法结合基于图论的方法进行图像分
割,在计算精度与计算效率方面均取得了很好的效果。



 

图像分割概述

来源于http://blog.csdn.net/zouxy09 

       所谓图像分割指的是根据灰度、颜色、纹理和形状等特征把图像划分红若干互不交迭的区域,并使这些特征在同一区域内呈现出类似性,而在不一样区域间呈现出明显的差别性。咱们先对目前主要的图像分割方法作个概述,后面再对个别方法作详细的了解和学习。

1、基于阈值的分割方法

      阈值法的基本思想是基于图像的灰度特征来计算一个或多个灰度阈值,并将图像中每一个像素的灰度值与阈值相比较,最后将像素根据比较结果分到合适的类别中。所以,该类方法最为关键的一步就是按照某个准则函数来求解最佳灰度阈值。

2、基于边缘的分割方法

       所谓边缘是指图像中两个不一样区域的边界线上连续的像素点的集合,是图像局部特征不连续性的反映,体现了灰度、颜色、纹理等图像特性的突变。一般状况下,基于边缘的分割方法指的是基于灰度值的边缘检测,它是创建在边缘灰度值会呈现出阶跃型或屋顶型变化这一观测基础上的方法。

阶跃型边缘两边像素点的灰度值存在着明显的差别,而屋顶型边缘则位于灰度值上升或降低的转折处。正是基于这一特性,可使用微分算子进行边缘检测,即便用一阶导数的极值与二阶导数的过零点来肯定边缘,具体实现时可使用图像与模板进行卷积来完成。

3、基于区域的分割方法

      此类方法是将图像按照类似性准则分红不一样的区域,主要包括种子区域生长法、区域分裂合并法和分水岭法等几种类型。

       种子区域生长法是从一组表明不一样生长区域的种子像素开始,接下来将种子像素邻域里符合条件的像素合并到种子像素所表明的生长区域中,并将新添加的像素做为新的种子像素继续合并过程,直到找不到符合条件的新像素为止。该方法的关键是选择合适的初始种子像素以及合理的生长准则。

        区域分裂合并法(Gonzalez2002)的基本思想是首先将图像任意分红若干互不相交的区域,而后再按照相关准则对这些区域进行分裂或者合并从而完成分割任务,该方法既适用于灰度图像分割也适用于纹理图像分割。

        分水岭法(Meyer1990)是一种基于拓扑理论的数学形态学的分割方法,其基本思想是把图像看做是测地学上的拓扑地貌,图像中每一点像素的灰度值表示该点的海拔高度,每个局部极小值及其影响区域称为集水盆,而集水盆的边界则造成分水岭。该算法的实现能够模拟成洪水淹没的过程,图像的最低点首先被淹没,而后水逐渐淹没整个山谷。当水位到达必定高度的时候将会溢出,这时在水溢出的地方修建堤坝,重复这个过程直到整个图像上的点所有被淹没,这时所创建的一系列堤坝就成为分开各个盆地的分水岭。分水岭算法对微弱的边缘有着良好的响应,但图像中的噪声会使分水岭算法产生过度割的现象。

4、基于图论的分割方法

        此类方法把图像分割问题与图的最小割(min cut)问题相关联。首先将图像映射为带权无向图G=<VE>,图中每一个节点NV对应于图像中的每一个像素,每条边∈E链接着一对相邻的像素,边的权值表示了相邻像素之间在灰度、颜色或纹理方面的非负类似度。而对图像的一个分割s就是对图的一个剪切,被分割的每一个区域CS对应着图中的一个子图。而分割的最优原则就是使划分后的子图在内部保持类似度最大,而子图之间的类似度保持最小。基于图论的分割方法的本质就是移除特定的边,将图划分为若干子图从而实现分割。目前所了解到的基于图论的方法有GraphCutGrabCutRandom Walk等。

5、基于能量泛函的分割方法

       该类方法主要指的是活动轮廓模型(active contour model)以及在其基础上发展出来的算法,其基本思想是使用连续曲线来表达目标边缘,并定义一个能量泛函使得其自变量包括边缘曲线,所以分割过程就转变为求解能量泛函的最小值的过程,通常可经过求解函数对应的欧拉(EulerLagrange)方程来实现,能量达到最小时的曲线位置就是目标的轮廓所在。按照模型中曲线表达形式的不一样,活动轮廓模型能够分为两大类:参数活动轮廓模型(parametric active contour model)和几何活动轮廓模型(geometric active contour model)。

       参数活动轮廓模型是基于Lagrange框架,直接以曲线的参数化形式来表达曲线,最具表明性的是由Kasset a1(1987)所提出的Snake模型。该类模型在早期的生物图像分割领域获得了成功的应用,但其存在着分割结果受初始轮廓的设置影响较大以及难以处理曲线拓扑结构变化等缺点,此外其能量泛函只依赖于曲线参数的选择,与物体的几何形状无关,这也限制了其进一步的应用。

       几何活动轮廓模型的曲线运动过程是基于曲线的几何度量参数而非曲线的表达参数,所以能够较好地处理拓扑结构的变化,并能够解决参数活动轮廓模型难以解决的问题。而水平集(Level Set)方法(Osher1988)的引入,则极大地推进了几何活动轮廓模型的发展,所以几何活动轮廓模型通常也可被称为水平集方法。