自组织SOM神经网络:
视频1:链接:http://pan.baidu.com/s/1mhI2NUg 密码:gzjk
视频2:链接:http://pan.baidu.com/s/1jICbyQi 密码:jyb0
视频资料:
链接:http://pan.baidu.com/s/1gfw83Xx 密码:7n9u
链接:http://pan.baidu.com/s/1hsalU8c 密码:rxvs
自组织SOM神经网络
自组织SOM神经网络是一种以无导师学习学习方式进行网络,具有自组织功能的神经网络。网络通过自身训练,自动对输入模式进行分类。
在网络结构上,自组织竞争网络一般是有输入和竞争层构成的单层网络,网络没有掩藏层,输入和竞争层之间的神经元实现双向链接,同时竞争层各神经元之间还存在横向连接。
自组织竞争网络的基本思想是网络竞争层各个神经元竞争对输入模式的响应机会,最后仅一个神经元成为竞争的胜者,并对那些与获胜神经元有关的各连接权值朝向更有利于竞争的方向调整。获胜神经元表示输入模式的分类。 SOM网络模型层结构图: 图中,输出层就是竞争层,因此SOM模型只有两层,竞争层之间的相互连接竞争输出。 由于SOM算法是一种无导师的聚类法,它能将任意维输入模式在输出层映射成一维或者二维离散图形,并保持其拓扑结构不变,即在无导师的情况下,通过对输入模式的自组织学习,在竞争层将分类结果表示出来,此外,网络通过对输入模式的反复学习,可以使连接权值空间分布密度与输入模式的概率分布趋于一致,即链接权向量分布能反映输入模式的统计特征。 SOM依据拓扑方程排列神经元,SOM拓扑结构: q Gridtop()网格拓扑结构; q Hextop()六角形拓扑结构; q Randtop()随机拓扑结构; 神经元之间的距离通过距离函数计算,如: q Dist(); q Boxdist(); q Linkdist(); q Mandist(); SOM的癌症样本分类预测 对一个样本库进行分析,该样本库含60个人的114种基因表达水平,其中前20个是癌症病人的基因表达水平的样本(其中可能有子类),其后的是20个正常人的基因表达信息样本,其余的20个是待检测的样本(未知它们是否正常)。 需要设法找出描述癌症与正常样本在基因表达水平上的区别,预测检测样本是癌症还是正常样本。 在竞争层中神经元之间相互竞争,最终只有一个或者几个神经元获胜,以适应当前的输入样本。竞争胜利的神经元就代表着当前输入样本的分布模式。 编写程序如下: - %% 患者癌症和正常样本SOM分类
- clc % 清屏
- clear all; % 删除workplace变量
- close all; % 关掉显示图形窗口
- format short
- % Initial
-
- %% 录入输入数据
- % 载入数据并将数据分成训练和预测两类
- load gene.mat;
- data=gene;
- P=data(1:40,:); % 前20个是癌症,后20个是正常样本
- T=data(41:60,:); % 待检测样本
-
- % 转置后符合神经网络的输入格式
- P=P';
- T=T';
- % 归一化操作
- [Pn,Ps]=mapminmax(P);
- [Tn,Ts]=mapminmax(T);
- % 取输入元素的最大值和最小值Q:
- % Q=minmax(P);
- Q=minmax(Pn);
-
- %% 网络建立和训练
- % 利用newc( )命令建立竞争网络:
- % Q为训练数据最大最小值
- % 2代表竞争层的神经元个数,也就是要分类的个数
- % 0.1代表学习速率
- net=newc(Q,2,0.1)
-
- % 初始化网络及设定网络参数:
- net=init(net);
- % 训练迭代次数
- net.trainparam.epochs=200;
- % 训练网络:
- % net=train(net,P);
- net=train(net,Pn)
-
- %% 网络的效果验证
-
- % 将原数据回带,测试网络效果:
- % a=sim(net,P);
- a=sim(net,Pn);
- % 使用变换函数vec2ind(),将单值向量组变换成下标向量
- % a:为n个元素值为1所在的行下标值构成的一个行向量。
- % ac:为m行n列的向量矩阵x,x中的每个列向量i,除包含一个1外,其余元素均为0。
- ac=vec2ind(a) % 分类标记
-
- %% 网络作分类的预测
- % 下面将后20个数据带入神经网络模型中,观察网络输出:
- % sim( )来做网络仿真
- % Y=sim(net,T)
- Y=sim(net,Tn)
- % 得到预测的可能性结果
- Yc=vec2ind(Y)
复制代码运行程序结果输出如下: - ac =
- Columns 1 through 10
- 1 2 1 1 1 1 1 1 1 1
- Columns 11 through 20
- 1 1 2 1 1 1 2 1 1 2
- Columns 21 through 30
- 2 2 2 2 2 2 2 1 2 2
- Columns 31 through 40
- 2 2 1 2 2 2 2 1 2 1
-
- Y =
- Columns 1 through 10
- 0 0 1 1 0 1 1 1 0 1
- 1 1 0 0 1 0 0 0 1 0
- Columns 11 through 20
- 1 1 1 1 1 1 0 1 0 1
- 0 0 0 0 0 0 1 0 1 0
-
- yc =
- Columns 1 through 10
- 2 2 1 1 2 1 1 1 2 1
- Columns 11 through 20
- 1 1 1 1 1 1 2 1 2 1
复制代码从预测结果可看出,预测结果能够较好的反映数据的类,即癌症样本和正常样本。
|