一种新颖的图像分割方法 - BlackEagle

来源:百度文库 编辑:神马文学网 时间:2024/04/27 21:03:43
一种新颖的图像分割方法收藏
摘要  图像分割就是在一幅影像中查找同类的区域。图像分割的应用范围涵盖了图像噪声的过滤以及特征的提取和识别。
在本文中我们提出了一种新颖的图像分割的方法,该方法的基本思想是把原始影像的分割问题分解成两步来完成,这两步的计算复杂度都比较小。第一步,首先通过解决大量的一维分割问题来初步估计被分割影像的梯度;第二步,通过增强无旋转的已有的矢量场把在第一步中获得的结果进行合并。
作为一个获得“次最佳”的解决方法的代价,由分解所获得的计算量的优势需要非常巧妙的算法,这个算法几乎不可能在一步中完成。真实影像和模拟影像都证明了该方法是行之有效的。
一、概述
图像分割就是在一幅影像中查找同类的区域。图像分割的应用范围涵盖了图像噪声的过滤以及特征的提取和识别。在遥感应用中,图像分割是极其困难的。事实上,图像(例如孔径雷达合成影像)可能被噪声严重干扰。此外,图像分割的好坏也没有明确的定义。
在本文中我们提出了一种新颖的图像分割的方法,该方法的基本思想是把原始影像的分割问题分解成两步来完成,这两步的计算复杂度都比较小。第一步,初步估计被分割图像的梯度。在这一步中,由于不需要获取无旋转的矢量场,使得我们的方法得到了巨大的简化。为了从矢量场中获取梯度然后把被分割图像重构成它的线性部分,这一步是必不可少的,并且可以作为一个独立的问题来处理。作为一个获得“次最佳”的解决方法的代价,由分解所获得的计算量的优势需要非常巧妙的算法,这个算法几乎不可能在一步中完成。
为了解决第一的子问题,例如初步估计被分割图像的梯度,在接下来我们要提到的解决方案中需要用到许多不同的技巧。由于分两步走,使得根据图像的行和列来独立地解决一维分割问题变得非常地简单。在一维条件下,需要复杂的分割技巧,但是如果在二维条件下处理这个问题则可能需要花费巨大的计算量。在其他方面,通过减轻不一致信号的作用,我们已经研究出提取边缘的可能性方法,这个方法类似于Mumford-Shah法。
第二步是本方法的核心,在这一步中,已获得的矢量场的零卷曲度被加强,这有助于恢复在初步梯度估计中的误差。这个问题可以被简化为限制最低的解决办法。正如本文在第二部分所提到的方法那样,L1米制法能够方便地用作误差估计标准,以便于获得一个健壮的解决方法和较高的计算效率。
本文提到的方法已经在模拟图像和真实SAR图像上得到证实,其结果是非常有希望的,并且证实了这个方法的合理性。
在本文的第二和第三部分将详细论述这个方法的第一步和第二步,并且在本文的第三部分演示试验的结果。
二、一维分割算法
让我们假设噪声破坏力是区域性相同的(在我们的例子中,一维信号来自图像的按行或按列的一部分,它是二维的,并且噪声的破坏力是区域性相同的),典型的噪声是可加的(比如光学图像)或者是可乘的(比如SAR图像)。分割的问题在于恢复同类区域(或段)。
在下面介绍的分割算法中,可乘性和可加性的噪声将区别对待。出于简单的考虑,在下面的处理中,我们将主要涉及到可加性噪声的情况,至于在可乘性噪音的情况下,处理是不一样的。
这个算法的主要思想来自对边缘的观察,分解信号时边缘表现出信号变动的特征。该算法采用迭代法。首先,信号的变化是可以计算出来的。其次,在两个区域中的信号的所有可能分割都被考虑到,并且这两个区域的信号变化要跟所有信号的变化做比较,比如可以计算它们的比率。紧接着,在所有比率中最小的比率可以确定,而不同的比率对应于不同的区域。如果这个比率比给定的阈值还要小,那么划分相应的两个区域的边缘就被检测出来。对被识辨的区域进行迭代,直到在所有当前区域中没有检测到边缘为止。前面所说的阈值作为参数输入到计算机内,它决定了分割的程度。
在可乘性噪声的情况下,一个区域内的信号和该区域内的均值两者之间的偏差是通过给定的比率的乘积幂来确定的,而不是通过它们的方差和确定的。因此,我们使用的是每两个区域的差异的乘积,而不是它们的和。
对原二维图像的行和列分别使用上述的一维分割算法,然后计算每个区域信号的导数,从而获得二维分割图像梯度的初步估计。
三、从一维到二维的分割
一般来说,在本文第二部分中所获得的二维分割图像梯度的估计并不是真正的梯度。事实上,如果它不是无旋转的矢量场(例如,沿着任何一个圆的离散线性积分都为零),初始函数是依赖于积分路径的,并且这个路径是不明确的。
接下来的问题是找出的初步估计梯度的最小改正值,以便于验证无旋转条件的正确性。也就是说,所需的改正值可以作为约束最小化问题的解决方法。如果用L1标准作为误差标准,那么就可以得到一个有效且健壮的解决方法。甚至,该方法还可以使约束最小化问题转变成了网络上的最小代价问题。其实,这个方法跟本文在第二部分所提到的方法是类似的。
在加强零卷曲条件后,通过对梯度求积分以明确地估计被分割图像。此外,加强无旋转条件也有助于恢复初步梯度估计误差。
注意到,在本文本部分所介绍的算法可以应用于任何的被分割图像的梯度估计,所以用本文第二部分所介绍的方法来获取梯度估计不是唯一的方法。
四、试验结果
本文所介绍的方法已经在模拟图像和真实图像上得到验证,特别是在难度更大的可乘性噪音的情况下也得到了验证。首先,让我们看看在模拟图像上获得的结果。图1显示的是一幅带有可乘性噪音的10视 SAR图像,图2显示了试验获得的分割图像。
在不同的相乘平均因素的SAR图像上做不同的试验。图3显示的是一幅包含有数个区域的3视的SAR图像,图4显示了所得的分割图像。注意到,虽然在原图像中出现相关的噪声扭曲,但是分割图像保持了大部分的区域边缘。图5显示的是一幅20视的SAR图像,图6显示了用两个不同的阈值所获得的分割图像。从图6(a)和(b)可以清楚地看到阈值是如何影响分割精度的。图6(a)是用一个较高的阈值获得的,它拥有较多的细节。较低的阈值允许更强的分割,但是会失去很多细节,如图6(b)所示。
评论
一、论文的主题思想和主要特色
把问题分解成若干个子问题,然后逐个予以解决,这往往是简化问题的最佳办法。论文的作者显然意识到了这点,并提出了一个较为新颖的图像分割方法,该方法的基本思想是把原始影像的分割问题分解成两步来完成:
第一步,初步估计被分割影像的梯度;
第二步,加强矢量场的零卷曲度,恢复在初步梯度估计中的误差。
这两步可以作为独立的子问题来解决。第一步的主要思想来自对边缘的观察,因为分解信号时边缘表现出信号变动的特征,这使得计算梯度成为可能,并用迭代法找出所有边缘;第二步是整个算法的核心部分,在这一步中,前面估计的梯度得到改正,从而获得一个健壮的算法。
通过分解,大大简化了问题的复杂度,并且极大地减小了计算量,试验证明其分割效果是令人满意的。但是该方法的缺点也是明显的,那就是它要求较高的算法技巧。
二、论文涉及到的图像处理与分析的技术
(1)阈值
阈值是在分割时作为区分物体与背景象素的门限,大于或等于阈值的象素属于物体,而其它属于背景。这种方法对于在物体与背景之间存在明显差别(对比)的景物分割十分有效。实际上,在任何实际应用的图像处理系统中,都要用到阈值化技术。为了有效地分割物体与背景,人们发展了各种各样的阈值处理技术,包括全局阈值、自适应阈值、最佳阈值等等。
在论文介绍的方法的第一步中,作者采用了阈值技术来检测区域的边缘,给定不同的阈值可以得到不同的分割效果。使用较大的阈值会得到较细致的分割,因而拥有较多的细节;使用较小的阈值会得到较粗糙的分割,因而失去很多细节。
(2)梯度
当物体与背景有明显对比度时,物体的边界处于图像梯度最高的点上,通过跟踪图像中具有最高梯度的点的方式获得物体的边界,可以实现图像分割。这种方法容易受到噪声的影响而偏离物体边界,通常需要在跟踪前对梯度图像进行平滑等处理,再采用边界搜索跟踪算法来实现。
在论文介绍的方法的第一步中,作者先初步估计出个被分割图像的梯度,考虑到噪声对区域边缘的有害影响,作者对可加性噪音和可乘性噪音加以区别对待。在第二步中,对在第一步获得的梯度估计进行改正,以便于更精确地获取区域边缘,从而实现图像分割。试验证明这种方法是行之有效的,并且可以获得较为理想的分割效果。
三、论文涉及的工作需要进一步解决的问题
从论文的图6(a)和(b)我们可以清楚地看到阈值是如何影响分割精度的。图6(a)是用较大的阈值得到的结果,它拥有较多的细节。图6(b)是用较低的阈值得到的结果,它失去很多细节。在这里,我们看到如何选择阈值,怎样选择阈值,对最后的分割效果有非常显著的影响。该论文的作者在他介绍的方法中并没有涉及到阈值的选择问题,而这个问题对图像分割是非常关键的。前面我提到确定阈值主要有三种方法:全局阈值、自适应阈值、最佳阈值。下面先简要介绍一下这三种方法:
(1)全局阈值  全局阈值是在整个图像中将灰度阈值的值设置为常数,这是采用阈值确定边界的最简单的方法。如果背景的灰度值在整个图像中可合理地看作为恒定,而且所有物体与背景都具有几乎相同的对比度,那么,只要选择了正确的阈值,使用一个固定的全局阈值一般会有较好的效果。
(2)自适应阈值  在许多情况下,物体和背景的对比度在图像中不是各处一样的,这时很难用统一的一个阈值将物体与背景分开。这时可以根据图像的局部特征分别采用不同的阈值进行分割。实际处理时,需要按照具体问题将图像分成若干子区域分别选择阈值,或者动态地根据一定的邻域范围选择每点处的阈值,进行图像分割。
(3)最佳阈值   阈值的选择需要根据具体问题来确定,一般通过实验来确定。对于给定的图像,可以通过分析直方图的方法确定最佳的阈值,例如当直方图明显呈现双峰情况时,可以选择两个峰值的中点作为最佳阈值。
论文中作者介绍的算法采用全局阈值,对整个图像进行迭代,找出所有边缘。正如上面所说的那样,如果所有物体与背景都具有几乎相同的对比度,那么,只要选择了正确的全局阈值,一般会有较好的效果。但是,在更多情况下,物体和背景的对比度在图像中不是各处一样的,如果这时候仍然使用全局阈值,那么肯定得不到理想的效果。所以在论文介绍的算法中涉及到阈值的选取问题,这使得这个“新颖的图像分割方法”的应用受到了限制。
如果在算法的第一步中,用阈值来检测边缘时在算法中把阈值的选取问题也考虑再内,那么这个算法将更加完善,其通用性也更强。下面介绍一个简单但更通用的阈值选取方法——基于直方图评价函数的阈值选取法。
该算法的主要思想是: 对于背景(或目标) 灰度不均匀的图像, 首先将其划分为若干个子区域, 通过判定子区域是否处于目标与背景的边界来计算各个子区域的阈值, 若某一子区域处在边界区, 则认为其灰度直方图会呈现较好的“双峰”性,搜索出子区域直方图的所有谷点作为候选阈值, 并通过计算直方图谷点评价函数来选择“最佳”谷点作为该子区域的阈值. 而对于那些未处于边界的子区域, 其区域阈值通过计算与其相邻的、而且已求得阈值的子区域的平均阈值来得到. 为此, 在计算各子区域阈值之前, 首先必须进行目标边界的标记。
其中直方图谷点评价函数Eav定义为:
Eav = Depth × Distance
式中, Depth 为谷点直方图左右相邻两峰的高度平均减去该谷点的高度的差,Distance为两峰间的间距.基于该式, 扫描峰点序列, 逐对计算相邻两峰间的谷点评价函数Eav, 使Eav 值为最大的双峰为理想的“双峰”, 双峰间的谷点为阈值.
虽然这个阈值选取方法不是目前“最佳”的方法——实际上,如何确定恰当的阈值,一直是图像处理研究的热点和难点,目前一个通用的阈值选取方法还不存在,通常都是根据被处理图像的实际情况在众多的阈值选取方法中选取一个“最佳”的方法——但是毕竟这个方法比起论文中作者使用的方法来更具通用性。如果在论文作者的算法把这些更好的阈直选取方法考虑在内的话,那么他的算法将更加健壮。
四、体会
数字图像处理,简单地说,就是用计算机进行图像处理, 即把连续的模拟图像转换成离散的数字图像,然后在数字域研究图像所含信息的提取、加工、传输等操作。20世纪50年代,计算机技术发展到相当水平后,计算机图像处理迅速发展并形成新的科学。这项技术首先用于宇航领域中,随后在卫星遥感、军事侦察、生物医学工程等应用中都取得极大的成功,从而更促进这个新学科理论、技术的完善和发展,并进一步扩大其应用领域,例如:实时处理、计算机视觉和虚拟现实等。这对图像处理提出了更高的要求,目前这一技术正向更高级的方向发展。
图像分割是图像处理与模式识别中一项重要而基础的技术手段。其目的是把图像分割成一些有意义的或者应用中感兴趣的区域,这些区域与现实中的各类目标相对应。为了辨识分析目标,必须将有关区域分离鉴别出来,在此基础上才有可能对目标的特征进行提取和测量。可以说,图像分割是成功地进行图像分析、理解和描述的前提条件。
阈值法是图像分割的一个主要方法,阈值分割法是将灰度图像变为二值图像以达到分割目的的方法,它是一种并行区域法。阈值法的过程是决定一个灰度值,用以区分不同的类,这个灰度值就叫做“阈值”。把灰度值大于阈值的所有像素归为一类,小于阈值的所有像素归为另一类。
阈值法是一种简单但是非常有效的方法,特别是不同物体或结构之间的有很大的强度对比时,能够得到很好的效果。阈值法一般可以作为一系列图像处理过程的第一步。它的主要局限是,最简单形式的阈值法只能产生二值图像来区分两个不同的类。另外,它只考虑像素本身的值,一般都不考虑图像的空间特性,这样就对噪声很敏感。针对它的不足,有许多经典阈值法的更新算法被提了出来。
阈值法分割图像的关键问题是选取恰当的阈值。