图像检测技术的研究现状
图像检测技术的研究现状
所谓图像检测,就是通过图像对感兴趣的特征区域(检测目标)进行提取的过程,其中图像是承载检测目标的载体,检测目标需要事先进行特征提取、归纳,最终通过相应算法分离出来。
图像检测方法可分为单帧图像检测和多帧图像检测。单帧图像检测主要是利用图像的灰度信息对目标进行分割,主要包括基于灰度阈值的目标检测方法和基于边缘信息的目标检测方法。
多帧图像检测通过序列图像的变化特征实现对目标的提取,主要用于运动目标的检测,大体包括:基于像素分析的方法、特征检测的方法和基于变换的方法。本文主要对单帧图像的检测方法进行详述。
1、基于灰度阈值的目标检测基于灰度阈值的目标检测是根据目标灰度与背景灰度的不同,通过选取合适的阈值将图像二值化,使得目标从背景中分离出来的过程。显然,阈值的选取是目标检测的关键,同样也是目标检测的难点,如何能得到合适的灰度阈值,最大程度的将目标提取出来,并消除背景的干扰,这一直是研究的热点。根据阈值选取数量的不同,基于灰度阈值的目标检测方法又可分为单阈值目标检测和多阈值目标检测。
单阈值目标检测适合于噪声少、照度均匀、目标和背景灰度值相差较明显的情况。最常用的方法有直方图分析法、迭代分割法。直方图分析法是多种空间域处理技术的基础,在目标相比背景比较突出的情况下,直方图会有明显的双峰现象,两峰之间的谷点即为最佳阈值,这种阈值选取方法又称为峰谷法。峰谷法主要在理想情况下对阈值进行选取,现实中采集图像的直方图经常会有峰值悬殊极大或宽平谷底的情况,一般需要通过分析直方图的凹形来确定一个较理想的全局阈值迭代分割法的实现过程是:首先对初始图像的最大灰度值和最小灰度值取平均,得到初始阈值T0;其次根据阈值T0将图像分为前景与背景,分别求得前景灰度平均值Vq和背景灰度平均值Vb,并对两者取平均得到T1;通过T1再次将图像分为前景与背景,通过对前景灰度平均值和背景灰度平均值取平均得到T2;如此往复,当|Tk+1-Tk| ε时(ε为一无穷小常数),我们认为Tk为最终阈值。迭代分割方法得到的阈值处在与前景和背景区域的重心成反比的位置,因此从路径规划的角度可看做一种最优阈值。此外,单阈值分割方法中还有最大类间方差法,最大熵分割法,贝叶斯分割法。其中,最大类间方差法通过寻找一个阈值,使分割后目标和背景之间的方差最大,仅适用于目标和背景所占比例相差不大的情况。最大熵分割法通过在规定的分布集合中寻找熵值最大者作为真实分布的一种判断,一般情况下由于推测分布与实际分布差距较大,错分率较大。贝叶斯分割法要求精确估算目标和背景先验概率,由于实际中采集图像存在大量噪声,处理效果会与预想差距较大。
多阈值分割方法是将图像分为多个具有不同区域特征的分块,在这些分块中分别采用不同的阈值对图像进行分割的方法。相比单阈值分割,它能够兼顾图像各处的情况,在有突发噪声、照度不均、各处对比度不同时对图像进行有效分割,特别是在目标和背景的灰度有梯度变化时效果最为明显。
2、基于边缘信息的目标检测图像的边缘包含了用于识别的有用信息,是图像分割所依赖的重要特征。边缘信息包含的往往是图像中最重要的信息,通常情况下边缘附近灰度值会发生剧烈变化,基于边缘信息的目标检测就是根据这一特征对目标的边缘进行检测,进而实现目标的定位。边缘检测最为通用的方法是检测亮度的不连续性,这样的不连续主要通过求一阶导数和二阶导数得到检测,若找到亮度的一阶导数在幅值上比指定的阈值大或二阶导数有零交叉的位置,可将其识别为边缘。基于边缘信息的目标检测方法大体包括:梯度算子检测、最优算子检测、多尺度信号处理方法、自适应平滑滤波法以及利用其它数学工具的边缘检测方法。
梯度算子检测是最基本的边缘检测方法,主要通过计算模板系数与所包围区域内灰度级的乘积之和,并与设定阈值T比较实现。一般情况下,设定的模板系数总和为零,在灰度不变的区域,模板响应也为零,而在灰度变化的区域,模板响应不为零,梯度算子就是依据这一特点对图像进行检测的。梯度算子主要包括Roberts算子、Sobel算子、Prewitt算子、Laplacian算子等。Roberts算子是数字图像中最简单的算子,经常用于图像检测的硬件实现中,不足之处是功能有限(如不能检测?45倍数的边缘)。Sobel算子和Prewitt算子是在实践中计算数字梯度时最常用的,基于Prewitt算子的图像检测相比Sobel算子在计算上要简单一些,但基于Sobel算子的图像检测在噪声抑制特性方面略胜一筹。Laplacian算子一般不以其原始形式用于边缘检测,主要原因是:作为一个二阶导数,它对噪声具有无法接受的敏感性,幅值产生双边缘且不能检测边缘方向,这些均是图像检测过程中不希望有的结果。
最优算子检测是在传统算子的基础上发展起来的边缘检测方法,主要有LOG(Laplacian of a Gaussian)算子、Canny算子以及基于曲面拟合的边缘检测算法。
LOG算子为高斯型的Laplacian算子,它将高斯型平滑函数与Laplacian算子相结合, 首先对图像进行平滑处理,然后使用Laplacian算子产生双边缘图像,最后通过找到两个边缘之间的零交叉定位边缘。其中,图像的平滑处理不仅减小了噪声的影响,还抵消了由Laplacian算子的二阶导数引起的逐渐增加的噪声影响,为Laplacian算子在边缘检测中发挥作用提供了有力的条件支持。采用LOG算子进行图像检测的优点是抗干扰能力强,边界定位精度高,连续性好,且能提取出对比度弱的边界;不足之处是当边界宽度小于算子宽度时,零交叉处的斜坡发生融合,小于2?2σ(σ为标准差)的区域边界细节会丢失。
Canny算子的基本思想是把边缘检测问题转换为检测单位函数的极大值问题,它根据边缘检测对好的信噪比与定位性能、边缘响应唯一性的要求,采用最优化数值方法,得到了对应给定边缘类型的最佳边缘检测模板。基于曲面拟合的边缘检测算法的基本思想是用一个平滑曲面与待测点周围某邻域内像素的灰度值进行拟合,在此基础上计算曲面的一阶或二阶导数。最早采用曲面拟合对图像进行边缘检测的是Prewitt,他首先采用最小二乘法用n阶多项式对原始图像拟合,然后用梯度算子在拟合曲面上进行边缘检测,取得了较理想的效果。Haralick在一个规则对称领域构造了正交多项式,对图像每一像素邻域灰度变化作曲面拟合,再用二阶方向导数的零交叉检测阶跃边缘,算法精度有较大提高,但由于正交多项式基构造过程复杂,灵活性差,不易表达复杂边界形状,应用受到了限制。
多尺度图像检测方法是在尺度空间滤波理论的基础上发展起来的,它不仅可以辨识出信号中的重要特征,而且能以不同细节程度对信号进行重构,在高级视觉处理中有广泛的应用。多尺度图像检测方法主要包括边缘聚焦和小波变换。边缘聚焦的基本思想是用一个很强的平滑在低分辨率下检测出重要边缘,再减弱平滑强度进行跟踪聚焦以确定其准确位置。它的特点是:可不使用阈值,所需计算量与最粗分辨率尺度上的计算量相同,很好的将定位的高精度与良好的噪声抑制结合起来。小波变换具有本质的多尺度特性,它能把图像信号分解成不同尺度上的多个分量,对图像进行多分辨率分析;利用小波变换进行多尺度边缘检测,能提高定位目标的准确度,取得良好的检测效果。20世纪80年代,在多分辨率理论中,小波首次作为分析基础出现。接着Mallat首次将小波变换用于信号奇异点的检测,奠定了小波在信号检测方面应用的基础[18]。在小波变换基础上发展起来的最新理论有1999年Donoho等人提出的curvelet变换,相比以往的小波变换在图像增强与去噪方面有了很大的提高。至今小波变换仍是学术界讨论的热点,在图像处理中也发挥着越来越重要的作用。
自适应平滑滤波是一种变尺度边缘检测方法,它的基本思想是用一个随像素点的梯度变化的平均模板与待平滑的信号进行迭代卷积。其中,模板函数以k为尺度变化参数,该参数控制了迭代过程中所要保留的突变点幅度,保证了在不同尺度下边缘检测的正确性。自适应平滑滤波方法通过自适应迭代平滑提高了图像的信噪比;在边缘检测之前对图像进行平滑滤波迭代运算,提高了边缘定位精度;相比其它边缘检测方法,在图像检测过程中具有很强的自适应能力。
除上述方法之外,许多学者一直致力于将各种数学思想引入图像的边缘检测中。20世纪80年代,Pal和King将模糊集理论与边缘检测相结合,提出了图像边缘检测模糊算法,该算法可对图像中的背景和目标进行有效的分离,成功应用在了模式识别与医疗图像处理领域。近年来,基于神经网络的边缘提取方法已成为一个重要的研究热点,其中基于BP网络的边缘检测方法已在许多领域得到应用。数学形态学引入图像处理,解决了噪声抑制、特征提取等问题。遗传算法作为一种优化算法也成功运用在边缘检测中。