云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 2013数学建模MATLAB培训程序

2013数学建模MATLAB培训程序

  • 62 次阅读
  • 3 次下载
  • 2025/6/15 2:13:54

MATLAB培训教材

结果T= 10 10 3 8 2 9 8 10 10 7 1 8 1 8 8 1 4 9 9 5 6

其可分为10个类,调整cutoff的值,将有不同的分类 2、 分步聚类 ① y=pdist (x),

squareform(y)

② Z=linkage(y) 结果 Z=

1.0e+004*

0.0007 0.0015 0.0068 0.0011 0.0016 0.0080 ........

0.0013 0.0023 0.0236

结果表明:国家7与国家15相连接,形成新类22,它们之间距离是68;国家16与国家11相连,形成新类23,它们之间距离是80,国家13与国家23相连,,形成新类25.... ③ 评价聚类信息 第一 可修改聚类树: c=cophenet(z,y) c=

0.9393

将pdist中计算方法指定为’Mahal’,’SEucllid’,’cityBloc’.重新计算pdist函数后,用copenet函数计算,得c 值分别为0.7486,0.8018,0.9291.均小于距离为欧氏距离时的计算结果,所以使用默认设置时的效果最佳。

第二、可了解与聚类连接相关的更多信息。 dendrogram(z)

I=inconsistent(z) ④ 创建聚类

第一.找到原始数据集合的自然分界: T=cluster(z,0.9)%分为10类 T=cluster(z,0.7)%分为16类

第二.通过指定系数进行聚类:如要将所有变量归为3类,则 T=cluster(z,3)

21

MATLAB培训教材

P47

例2.下表给出2007年我国31个省、市、自治区和直辖市的城镇居民家庭平均每人全年的消费性支出的8个主要变量数据,数据保存在文件:examp09-02.xls中,试对各地区进行聚类分析。 地区 食品 衣着 居住 家庭设医疗保交通和教育文杂项商备及服健 通信 化,娱品和服务 乐服务 务 4934.05 1512.88 1246.19 981.13 1294.07 2328.51 2383.96 649.6 北京 4249.31 1.24.15 1417.45 760.56 1163.98 1309.94 1639.83 463.69 天津 1、 数据的读取和标准化 [x,textdata]=xlsread(‘examp09-02.xls’); X=zscore(x);%标准化数据 2、 一步聚类

obslabel= textdata(2:end,1):%提取城市名称,为后面做准备。 Taverage=clusterdata(x,’linkage’,’average’,’maxclust’,3);

%用欧氏距离,类平均法将原始样品分为3类。 obslabel(Taveerage==1)%查看第一类包含的城市。 obslabel(Taveerage==2) obslabel(Taveerage==3) 3、 分步聚类

①》y=pdist(x). %计算距离

②》z=limkage(y,’average’). %用类平均法创建系统聚类树。 ③》作出聚类树图形

obslabel=textdata(2 :end,1) ;

H=dendrogram(z,0,’orientation’,’right’,’labels’,obslabel) ;%返回线条句柄H set(H,’linewidth’,2,’color’,’k’) ;%设置线条宽度为2,颜色为黑色。 Xlabel(’标准化距离类平均法’).%为x轴加标号。 ④确定分类个数

inconsistent0= inconsistent(z,40).%计算不一致系数,深度为40.

该矩阵第4列为每次并类的不一致系数,在并类过程中,若某一次并类所对应的不一致系数较上一次有大幅度增加,说明该次并类的效果不好,而它上一次的并类效果是比较好的,不一致系数增加幅度越大,说明上一次并类效果越好,在使得类的个数尽量小的前提下,可参照不一致系数的变化,确定最终的分类个数。

考虑最后3次聚类中不一致系数的变化,增加依次为0.7071,0.7265,和1.9537,这说明 倒数第二次并类的相关是比较好的,此时原样品被分为2类,即可认为分为2类是合适的。 例3、某地成年女子14个部位尺寸之间的相关系数矩阵如下数据保存在文件examp09-03.xls中。

1、 读取数据

[x,textdata]=xlsread(‘examp09-03.xls’). 2、 计算距离

变量xi和xj的相关系数为Pij,则距离为dij?1??ij

y=1-x(x~=1&~isnan(x))’ %提取x矩阵的不等1和NaN的元素,并转为距离向量。 3、 创建聚类树

z=linkage(y,’average’) 4、 作树形图

varlabel=textdata(2 :end,1) ;

H=dendrogram(z,0,’orientation’,’right’,’labels’,varlabel) ; Set(H,’Linewidth’,2,’color’,’k’) ; Xlabel(‘并类距离(类平方法)’)

由结果知:14个变量可分为两大类,每大类又可再细分。

22

MATLAB培训教材

P49

例1、在我国山区某大型化工厂及邻近地区挑选有代表性的15个大气取样点每日4次同时抽取大气样品,测定其中含有的6种气体的浓度,前后共4天,每个取样点每种气体实测16次,计算每个取样点每种气体的平均浓度,数据如下表。气体数据对应的污染地区分类如表中最后一列所示。现有两个取自该地区的4个气体样本气体指标如表后4行所示,试判别这4个样品的污染分类。 气体 氮 氯化氢 二氧化硫 碳4 环氧氯丙烷 环乙烷 污染分类 1 0.056 0.084 0.031 0.038 0.0081 0.022 1 2 0.04 0.055 0.1 0.11 0.022 0.0073 1 3 0.05 0.074 0.041 0.048 0.0071 0.02 1 4 0.045 0.05 0.11 0.1 0.025 0.0063 1 5 0.038 0.13 0.079 0.17 0.058 0.043 2 6 0.03 0.11 0.07 0.16 0.05 0.046 2 7 0.034 0.095 0.058 0.16 0.2 0.029 1 8 0.03 0.09 0.068 0.18 0.22 0.039 1 9 0.084 0.066 0.029 0.32 0.12 0.041 2 10 0.085 0.076 0.019 0.3 0.01 0.04 2 11 0.064 0.072 0.02 0.25 0.028 0.038 2 12 0.054 0.065 0.022 0.28 0.021 0.04 2 13 0.048 0.089 0.062 0.26 0.038 0.036 2 14 0.045 0.092 0.072 0.2 0.035 0.032 2 15 0.069 0.087 0.027 0.05 0.089 0.021 1 样品1 0.052 0.084 0.021 0.037 0.0071 0.022 样品2 0.041 0.055 0.11 0.11 0.021 0.0073 样品3 0.03 0.112 0.072 0.16 0.056 0.021 样品4 0.074 0.083 0.105 0.19 0.02 1 training=[0.056,0.084,0.031,0.038,0.0081,0.022………0.021]; Group=[1 1 1 1 2 2 1 1 2 2 1 1 2 2 2 2 2 2 1]’; Sample=[0.052 0.084 0.021 0.037 0.0071 0.022….. 1.000]; Cluss=classify(sample,training,group): 结果class= 1 1 2 2

例2、对21个破产的企业收集它们在破产前2年的年度财务数据,同时对25个财务良好的企业也收集同一时期的数据。4个变量:

X1:现金流量/总债务;X2:净收入/总资产;X3:流动资产/流动债务;X4:流动资产/净销售额。 部分数据如下:

企业编号 组别 x1 x2 x3 x4 1 1 -0.45 -0.41 1.09 0.45 2 1 -0.56 -0.31 1.51 0.16 …………………………………………………….

46 2 0.58 0.04 5.06 0.13 47 -0.16 -0.10 1.45 0.51 48 0.41 0.12 2.01 0.39 49 0.13 -0.09 1.26 0.34 50 0.37 0.08 3.65 0.43 数据保存在文件examp10-01.xls中。 1、 读取数据

sample=xlsread(‘examp10-01.xls’,’’,’c2:F51’);

23

MATLAB培训教材

training= xlsread(‘examp10-01.xls’,’’,’c2:F47’); group= xlsread(‘examp10-01.xls’,’’,’c2:F47’); obs=[1:50]’; %企业编号 2、 距离判别

[c,err]=classify(sample,training,group,’mahalanobis’); [obs,c] %查看结果

err %查看误差概率。

从上知,共有3个发生了误判:15,16,34. P51

例1、从协方差矩阵或相关系数矩阵出发求解主成分。

在制定服装标准的过程中,对128个成年男子的身材进行测量,得相关系数矩阵如下,试进行主成分分析。 变量 x1 x2 x3 x4 x5 x6 身高(x1) 1 0.79 0.36 0.76 0.25 0.51 坐高(x2) 0.79 1 0.31 0.55 0.17 0.35 胸围x3 0.36 0.31 1 0.35 0.64 0.58 手臂长x4 0.76 0.55 0.35 1 0.16 0.38 肋围x5 0.25 0.17 0.64 0.16 1 0.63 腰围x6 0.51 0.35 0.58 0.38 0.63 1 PHO=[1 0.79 0.36 0.76 0.25 0.51 0.79 1 ...... ...

...... 0.63 1] ;

[COEFF,latent,explained]=pcacov(pho) %为了更加直观,以元胞数组形式显示结果。 result1(1,:)={‘特征值’,’差值’,’贡献率’,’ 贡献率’}; result1(2:7,1)=num2cell(latent);

result1(2:6,2)=num2cell(-diff(latent));

result1(2:7,3:4)=num2cell([explained,cumsum(explained)]); %元胞数组形式显示前3个主成分表达式。

s={‘标准化变量’,’x1:身高’,’x2:坐高’,’x3:胸围’,’x4:手臂长’,’x5:肋围’,’x6:腰围’}; result2(:,1)=s;

result2(1,2:4)={‘prin1’, ‘prin2’, ‘prin3’}; result2(2:7,2:4)= num2cell(COEFF(:,1:3));

从sesult1的结果来看:前3个主成分的结果的 贡献率达到了85.8756%,因此可只用前3个主成分进行分析,由result2中知前3个主成分表达式分别为:

??????y1?0.4689x1?0.4037x2?0.3936x3?0.4076x4?0.3375x5?0.4268x6.?????? y2??0.3648x1?0.3966x2?0.3968x3?0.3648x4?0.5692x5?0.3048x6??????y3??0..0922x1?0.6130x2?0.2789x3?0.7048x4?0.1643x5?0.1193x6从第一主成分y1表达式来看,它在每个标准变化变量上有相近的负载荷,说明每个标

?准化变量对y1的重要性都差不多。当一个“五大三粗”的人,xi的值都较大,此时y1的值

就比较小,反之y1就大,因此,可认为第一主成分y1是身材的综合成分(或魁梧成分)。

从第二主成分y2表达式来看,当x1,x2,x3增大时,y2的值减小,当x4,x5,x6增大时,y2的值增大,即,一个人的身材瘦高时,y2的值小,当一个人的身材矮胖时,y2的值比较大,因此,可认为y2是身材的高矮和胖瘦的协调成分。

从第三主成分y3的表达式来看,x2和x4对y3的影响比较大。也就是说y3反映了坐高

24

????????

搜索更多关于: 2013数学建模MATLAB培训程序 的文档
  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

MATLAB培训教材 结果T= 10 10 3 8 2 9 8 10 10 7 1 8 1 8 8 1 4 9 9 5 6 其可分为10个类,调整cutoff的值,将有不同的分类 2、 分步聚类 ① y=pdist (x), squareform(y) ② Z=linkage(y) 结果 Z= 1.0e+004* 0.0007 0.0015 0.0068 0

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com