Parzen窗

Halcom · 发表于 2017-2-4 21:12:42

非参数检验方法，考虑有N个数据点，x属于R ，i=1,2,……，N ，采用Parzen窗来估计未知的密度函数，具体的表达式如下：

p(x) = sum(fai( (x-xi)/h )) / N/ h

其中N足够大，h充分小，通常由用户自己设定。fai( x ) 函数为核密度估计函数。通常核密度估计函数采用高斯分布函数，因此有：

p(x) = 1/N * sum( exp(-(x-xi)^2/2/h/h )/h/sqrt(2*pi) )

MATLAB代码如下：

clc,clear,close all % 清屏、清工作区、关闭窗口
warning off % 消除警告
feature jit off % 加速代码执行
% 概率密度函数实际是一个混合高斯分布函数
% 采用 generate_gauss_classes函数产生所需要的数据
m=[1; 4]'; % 初始化
S(:,:,1)=[0.3];
S(:,:,2)=[0.3];
P=[2/3 1/3];
N=1000;
randn('seed',0);
[X]=generate_gauss_classes(m,S,P,N);
% 绘图pdf
x=-5:0.1:5;
pdfx=(2/3)*(1/sqrt(2*pi*0.2))*exp(-.5*((x-1).^2)/0.2)+(1/3)*(1/sqrt(2*pi*0.2))*exp(-.5*((x-4).^2)/0.2);
plot(x,pdfx); hold on;
%Parzon窗计算，h = 0.1 and x in [-5, 5]
h=0.1;
pdfx_approx=Parzen_gauss_kernel(X,h,-5,5);
plot(-5:h:5,pdfx_approx,'r');
legend('原始分布函数','Parzen窗逼近效果')

复制代码

相应的函数如下：

复制代码

产生服从高斯分布的数据集

复制代码

		自动登录	找回密码
密码			立即注册