基于Gist特征的人脸识别:
图像的Gist特征提取.在实际的实现中采用的是将图像与不同方向和不同尺度的Gabor滤波器组进行滤波,将滤波后得到的图像划分为网格,在每个网格内部取平均值,最后将滤波后得到的所有图像的每个网格均值级联起来,得到图像的Gist特征。 一幅大小为hxw的灰度图像f(x,y)用nc个通道的滤波器对图像进行卷积滤波,其中,nc等于滤波器尺度和方向数的乘积,这样得到nc个滤波后的图像:将每幅滤波后的图像划分为4x4的网格,每个网格内取平均值得到一个特征。将每个网格块的特征级联起来,得到图像的Gist特征,即: Gi(x,y)=cat(f(x,y)*g(x,y)) 其中,cat为级联符号,*为卷积符号,g(x,y)为Gabor滤波器组。 局部Gist特征是将上述特征提取过程中的网格划分改为由16x16的网格进行划分,对于每一个网格再次采用大小为4x4的网格进行划分,将每一个二级网格采取加权求和,权重矩阵W构建方法为对应像素到各子区域中心像素归一化距离的倒数,再将所有的二级子网格特征进行级联,得到局部Gist特征。该方法细化了场景特征的提取,有效地降低了同一网格中包含不同场景的概率,从而提高了场景分类的正确率,但其还存在一个问题,就是提取的特征维数过高。如一幅大小为256x256像素的图像,其提取后的特征维数为:16x16x4x4x32=131072维。如果不采取降维处理等手段,特征维数过于庞大,包含很多冗余信息,同时,给数据处理带来很大的困难。
参考:
【1】基于Gist和PHOG特征的场景分类
|