当前位置:首页 > 南昌航空大学A周易文、汪文霞、王颖然
* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+
4 ─┐ 15 ─┤ 20 ─┤ 18 ─┤ 19 ─┤ 11 ─┤ 12 ─┤ 7 ─┤ 22 ─┤ 9 ─┤ 23 ─┤ 1 ─┤ 8 ─┤ 2 ─┤
13 ─┼───┐ 25 ─┤ │ 17 ─┤ │ 24 ─┤ │ 5 ─┤ │
10 ─┤ ├───────────────────────────────────────────┐ 16 ─┤ │ │ 27 ─┤ │ │ 14 ─┤ │ │ 26 ─┘ │ │ 6 ─────┘ │ 3 ───────┬─────────────────────────────────────────┘ 21 ───────┘
2. 白葡萄
若样品将样品分为3类,样品27和28为一类,22~26样品为一类,1~21样品为另外一类。综合结果,可以看出样品27和样品28为一级,22~26样品为二级,1~21样品为三级。
* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *
11
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+
4 ─┐ 26 ─┤ 20 ─┤ 2 ─┤ 9 ─┤
10 ─┼───┐ 6 ─┤ │ 12 ─┤ │ 7 ─┤ │ 11 ─┘ │ 14 ─┐ │ 23 ─┼───┤ 21 ─┘ │
16 ─┐ ├─────┐ 19 ─┤ │ │ 13 ─┤ │ │ 8 ─┼───┤ │ 18 ─┤ │ │
17 ─┤ │ ├─────────────────────────────────────┐ 22 ─┘ │ │ │ 1 ─────┘ │ │ 5 ─┐ │ │ 25 ─┼─┐ │ │ 15 ─┘ ├─┐ │ │ 24 ───┘ ├─────┘ │ 27 ─────┘ │ 3 ─────────┬───────────────────────────────────────┘ 28 ─────────┘
5.3 问题三
模型IV:分析酿酒葡萄与葡萄酒理化指标之间的联系 5.3.1模型建立
1.定义A矩阵来存放酿酒葡萄的理化指标和葡萄的理化指标。
每一行代表一向指标对应的各样品的数值。每一列代表一个样品的各指标的数值。
aA?aa1121aaa1222aaa1n2n
m1m2mn因为各指标原始数据量纲不同,数量级差也悬殊,所以要进行数据预处理,消除量纲,合并数量级,使其具有可比性。 2.进行均值化变换:
bij?pja;(1?i?p?1,1?j?n) aa(p?i?m,1?j?n) ?baiji1iji1 12
得到变换后的矩阵B:
bbB?b
3.令(k=p-1)。
1121bbb1222bbb1n2n
p1p2pncij?b?bijpj(1?i?k,1?j?n)得到差值后的矩阵C。
cC?cc1121ccc1222ccc1n2n
k1k2kn再用C语言的查找程序来实现对C矩阵中最大最先元素的寻找。 令 C矩阵中的最大几的记作:cmax
最小记:cmin
cmin?cmax?(1?i?k,1?j?n) dijcij?cmax这就是相关系数了。
由此我们可以来求关联系数矩阵D:
dD?dd再记关联度为sumi,即
1121dddi1222dddnij1n2n
k1k2knsum??dj?1
由此可以得到关联度的平均值:
(1?i?k)。 n 4.通过C语言编写程序(见附录描述2),我们可以得到所有的关联度的值。
5.3.2模型求解
考虑到若将全部数据输入运算量太大的原因,我们可以分别取部分酿酒葡萄和葡萄酒的理化指标的数据输入,得出他们之间的关联度的值,从而可以知道这些理化指标之间的联系。
此处以部分数据为例,输入:
974.380 ,518.083 ,399.938 ,183.688 ,280.959 ,117.727 ,91.426 ,918.856 ,388.667 ,139.853 ,11.030 ,11.146 ,13.250 ,6.511 ,5.849 ,7.378 ,4.019 ,12.052 ,1
if?sumni??dj?1nij 13
2.957 ,
5.586 ,10.003,9.591,8.580,6.003,6.065,5.858,3.879,10.292,11.364,4.435,7.912 ,13.336 ,7.311 ,4.245 ,3.597 ,4.491 ,2.719 ,7.681 ,9.838 ,3.135 ,2.4382 ,3.6484 ,5.2456 ,2.9337 ,4.9969 ,4.4311 ,1.8205 ,1.0158 ,3.8599 ,3.2459 ,0.357 ,0.458 ,0.395 ,0.177 ,0.206 ,0.211 ,0.112 ,0.345 ,0.384 ,0.136 ,2.480 ,14.260 ,16.390 ,42.300 ,34.460 ,56.950 ,59.000 ,8.600 ,14.170 ,57.090 ,16.100 ,45.770 ,48.040 ,59.530 ,60.160 ,54.430 ,48.820 ,38.860 ,46.090 ,58.060 ,3.880 ,24.060 ,27.560 ,26.750 ,24.050 ,23.570 ,32.070 ,14.680 ,24.190 ,8.000 ,2027.96 ,2128.82 ,8397.28 ,2144.68 ,1844.00 ,3434.17 ,2391.16 ,1950.76 ,2262.72 ,1364.14 ,553.889 ,625.683 ,583.455 ,529.028 ,587.292 ,535.104 ,487.888 ,557.728 ,701.652 ,546.102 ,0.254 ,0.060 ,0.317 ,0.098 ,0.030 ,0.078 ,0.128 ,0.186 ,0.639 ,10.300 ,406.767 ,223.134 ,156.659 ,78.420 ,119.341 ,44.927 ,59.535 ,240.122 ,239.602 ,42.952 ,2.060 ,9.930 ,8.080 ,3.770 ,9.490 ,2.830 ,5.820 ,5.710 ,13.230 ,2.450 ,18.210 ,4.750 ,2.960 ,5.230 ,3.770 ,2.210 ,7.740 ,13.550 ,4.120 ,2.300
得出结果见附录描述2。 5.4问题四
5.4.1模型V:分析酿酒葡萄和葡萄酒理化指标对葡萄酒质量的影响
问题分析中已指出,此模型可以应用因子分析的方法反映各变量之间的联系。 1.模型建立
此处运用R型因子分析,对变量做降维处理。 R型因子分析的数学模型:
a11??F1???1??X1??a11a11????????Xaaa2111111???????F2?+??2?????????????????Xaaa?P??111111??Fm???P?
其中X是可以测量的p维随机向量,每一个分量代表一个指标或者变量。F为 不可观察的m维随机变量,其各个分量来自每个变量之中,因此称为公共因子。矩阵A称
a为因子载荷矩阵,ij表示第i个变量在第j个公共因子上的相对重要程度。?向量是特殊因子,包含不能解释的随机扰动项。该模型满足以下条件: (1)m?p
(2)Cov(F,?)=0,即F和?不相关。
1m不相关且方差皆为I。,i?j;D(F)=Im。即F...F
2Cov(?i,?j)=0,即?1...?m不相关且方差不同。i?j;D(?)=?。i (4)
(3)
Cov(F,Fij)=0
2.模型求解
根据以上建立的模型,对附件中的数据用SPSS软件进行因子分析。分析结果如下:
14
共分享92篇相关文档