当前位置:首页 > 显著性检测
显著性检测
视觉注意机制(Visual Attention Mechanism,VA),即面对一个场景时,人类自动地对感兴趣区域进行处理而选择性地忽略不感兴趣区域,这些人们感兴趣区域被称之为显著性区域。人类视觉注意机制有两种策略,即采用自底向上策略注意机制和采用自顶向下策略注意机制。前者利用图像的颜色、亮度、边缘等特征表示,判断目标区域和它周围像素的差异,进而计算图像区域的显著性。后者针对图像的特定特征来计算图像区域的显著性。
显著性检测就是提取图像中重要的、人类感兴趣的区域。根据显著性区域的应用不同,产生了很多不同的显著性区域定义,相应的显著性检测算法也不相同。按检测目标,显著性检测可分为基于显著性点的显著性检测和基于显著性对象(图像前景)的显著性检测。前者以最能引起人类视觉系统的点为检测目标,后者以最能引起人类视觉系统的前景为检测目标。按显著性检测的变换域,显著性检测还可以分为时域显著性检测和变换域显著性检测。下面我们介绍几种经典的显著性检测方法。
Itti等人提出Itti视觉注意力模型。根据视觉系统的行为和神经网络结构,它是经典的基于自底向上策略视觉注意力模型。该模型组合多尺度图像特征到一个单一视觉显著性图中。首先,通过线性滤波对图像颜色、亮度、方向等特征进行提取。其次,通过高斯金字塔、中央周围(center-surround)算子和归一化处理获得显著性图,其中包括6个亮度特征图、12个色彩特征图和24个方向特征图。最后,再根据显著图确定图像显著性区域,从而实现图像的显著性检测。
Hou等人提出了一种基于傅里叶频谱残差(Spectrum Residual,SR)的分析方法。该方法将输入图像进行对数频谱分析,去除对数频谱中的通用信息,得到目标的频谱信息,最后利用傅里叶反变换得到其显著性映射,即得到其空间域对应的目标区域。我们可以通过阈值选择确定重要物体。该方法原理简单、运算速度快并且具有较强的抗干扰性。
Guo等人提出了基于四元数傅里叶变换相位谱(PQFT)信息来计算图像的显著性映射。每幅图像的每个像素都用四元数表示,即两个颜色通路、一个强度通路和一个运动通路。然后,用其四元数傅里叶变换相位谱来求其显著性映射,也就是对四元数进行傅里叶变换,仅用它的相位信息做傅里叶反变换得到其显著性映射。该方法的显著性映射提供主要物体的位置。因此可以通过阈值的选取,在显著性映射结果中提取重要物体。本文提出的模型增加了有效的运动信息,不仅能够应用于图像中,同时在视频中也同样适用
图像显著性检测在图像处理相关领域有非常广泛的应用,例如:图像编辑、基于内容的图像缩放、自动聚焦以及图像智能压缩等,应用较为广泛。
共分享92篇相关文档