云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 城市表层土壤重金属污染问题 2011年数学建模获奖论文 - 图文

城市表层土壤重金属污染问题 2011年数学建模获奖论文 - 图文

  • 62 次阅读
  • 3 次下载
  • 2025/5/2 12:03:36

5.2、对于问题二: 5.2.1 极差标准化变化 5.2.1 数据极差标准化

极差标准化变换是指将一组数据变换为均值为0, 极差为1的另一组数据,

*?数据x1,x2,x3....,xn的极差标准化变换为xk_xk-x,k?1,2....,n。其中RX

—1n??Xk和R分别为数据x1,x2,x3....,xn的样本均差和极差. nk?1

5.2.2 研究方法——理论:

本问题采用多元统计数学方法之一的因子分析,它根据多个实测变量之间的相互关系,运用数学变换,将多个变量转变为少数几个线性不相关的综合指标,从而简化数据处理,其目的在于对大量观测数据,用较少的有代表性的因子来说明众多变量所提取的主要信息,提示出多个变量间的因果关系。

因子分析从变量的相关矩阵出发将一个m 维的随机向量X分解成低于m 个且有代表性的公因子和一个特殊的m 维向量,使其公因子数取得最佳的个数,从而使对m 维随机向量的研究转化成对较少个数的公因子的研究。设有n 个样本,n 个指标构成样本空间X X?(xij),n?m,i?1,2,......,n;j?1,2,......,m (Xij?Xj)因子分析过程一般经过以下步骤:

Xij?'(1)原始数据的标准化,标准化的公式为

?j,其中

xij为第i 个

X?样本的第j 个指标值,而j和j分别为j 指标的均值和标准差。标准化的目的

在于消除不同变量的量纲的影响,而且标准化转化不会改变变量的相关系数。 (2)计算标准化数据的相关系数阵,求出相关系数矩阵的特征值和特征向量。 (3)进行正交变换,使用方差最大法。其目的是使因子载荷两极分化,而且旋转后的因子仍然正交。

(4)确定因子个数,计算因子得分,进行统计分析。

因子分析只强调变量的离差(变化量)而不强调变量在样品中的比重(百分含量)。因子分析的数学模型中,通过正交的方差最大旋转法使每一个主因子只与最少个数的变量有相关关系,而使足够多的因子负荷均很小。变量或因子的重要程度都是以其方差大小来衡量的。因子旋转后每个变量因子负荷代表着在系统中作用或重要性程度,以各个变量目标因子载荷平方与因子方差贡献率乘积作为变量的权重,构成一个判别污染来源的综合指标,而且因子分析是一个客观计算同主观思维相结合的过程。其它多元统计分析(如判别分析,回归分析)的计算结果基本上是一个最终结果,可以直接予以应用,但因子分析的计算结果(因子解)只能看作是一个中间结果,剩下的部分要求人们用自己的思维来完成,这就涉及环境地球化学知识、经验,甚至于思维方式和哲学思想。

- 7 -

5.2.2、数据分析

城市土壤单点样重金属元素含量的数据特征完全符合因子分析的要求,在这里以Hg、Cd、Pb、As、Cu、Cr、Ni、Zn八种重金属元素指标作因子分析,这样在解释各指标变化异常时可以着重讨论综合指标因子,同时为城市重金属污染成因的解释提供一定的理论依据。以下对城市土壤单点样重金属元素含量的数据标准化处理后,经SPSS18.0 统计软件进行因子分析,可得出以下结果。首先给出城市表层土壤Hg、Cd、Pb、As、Cu、Cr、Ni、Zn八种重金属原始含量数据的相关系数矩阵,如表四所示。

相关矩阵 As As Cd Cr Cu Hg Ni Pb Zn 1.000 .255 .189 .160 .064 .317 .290 .247 Cd .255 1.000 .352 .397 .265 .329 .660 .431 Cr .189 .352 1.000 .532 .103 .716 .383 .424 Cu .160 .397 .532 1.000 .417 .495 .520 .387 Hg .064 .265 .103 .417 1.000 .103 .298 .196 Ni .317 .329 .716 .495 .103 1.000 .307 .436 Pb .290 .660 .383 .520 .298 .307 1.000 .494 Zn .247 .431 .424 .387 .196 .436 .494 1.000 相关 <表四:相关矩阵>

可见,Cr和Ni的相关性最好,相关系数最大,为0.716,其次为Pb 和Cd,相

关系数为0.6260,以下依次是Cr和Cu,Pb和Cu的相关性较好,相关系数分别为0.532和0.520,Ni和Cu的相关系数为0.495,其它元素之间的相关性并不是很好。从成因上来分析,相关性较好的元素可能在成因和来源上有一定的关联。

因子分析的关键就是利用相关系数矩阵求出相应的因子的初始特征值和累计贡献率,用SPSS18.0统计软件计算可得出,见表五: 解释的总方差 成份 初始特征值 方差合计 1 2 3 3.560 1.150 .965 的 % 44.500 14.377 12.063 累积 % 44.500 58.877 70.941 合计 3.560 1.150 .965 提取平方和载入 方差的 % 44.500 14.377 12.063 累积 % 44.500 58.877 70.941 合计 1.827 1.525 1.045 旋转平方和载入 方差的 % 22.834 19.063 13.068 累积 % 22.834 41.897 54.965 - 8 -

4 5 6 7 8 .768 .578 .432 .301 .246 9.596 7.220 5.399 3.769 3.076 80.537 87.756 93.156 96.924 100.000 .768 .578 .432 9.596 7.220 5.399 80.537 87.756 93.156 1.032 1.020 1.004 12.898 12.744 12.549 67.863 80.607 93.156 提取方法:主成份分析。 <表五:解释的总方差>

在累积方差为93.156%(>90%)的前提下,分析得到6个主因子,可以看

到6 个主因子提供了源资料的93.156%的信息,满足因子分析的原则,而且从上表可以看出旋转前后总的累计贡献率没有发生变化,即总的信息量没有损失。从表2还可得出,旋转之后,主因子1的方差贡献率为45%左右,主因子2和主因子3 的方差贡献率均为13%左右,主因子4到主因子6的方差贡献率的范围为5.399%到9.596%之间。这可以解释为因子1 可能为城市土壤重金属污染的最重要的污染源,对城市重金属污染的贡献最大,因子2、因子3、因子4、因子5、因子6对城市重金属污染有重要作用。

因子分析的主要目的是将具有相近的因子荷载的各个变量置于一个公因子之下,正交方差最大旋转使每一个主因子只与最少个数的变量有相关关系,而使足够多的因子负荷均很小,以便对因子的意义作出更合理的解释。输出结果见表六和表七。

成份矩阵a 成份 1 As Cd Cr Cu Hg Ni Zn Pb .426 .711 .735 .756 .408 .723 .699 .764 2 -.200 .281 -.444 .125 .673 -.515 -.037 .314 3 .681 .282 -.303 -.365 -.297 -.190 .123 .237 4 .551 -.322 -.046 .137 .449 .137 -.241 -.248 5 -.026 -.254 -.110 -.155 .154 -.014 .654 -.158 6 -.065 .325 .098 -.408 .236 .200 -.060 -.217 提取方法 :主成份。 - 9 -

a. 已提取了 6 个成份。

1 As Cd Cr Cu Hg Ni Zn .135 .223 .859 .395 .017 .890 .261 .073 旋转成份矩阵a 成份 2 .130 .918 3 .016 .148 4 .974 .086 .004 .031 .016 .196 .097 .162 5 .043 .031 .245 .810 .173 .103 .122 .496 6 .084 .126 .141 .110 .069 .170 .916 .275

.187 -.016 .177 .137 .101 .235 .718 .273 .967 .051 .082 .061 Pb 提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 a. 旋转在 6 次迭代后收敛。 <表六.成分矩阵> <表七.旋转成分矩阵> 由表六和表七可见,旋转前后因子荷载的变量结果基本一致。变量与某一个因子的联系系数绝对值(载荷)越大,则该因子与变量关系越近。正交因子解说明:因子1 为Cr和Ni的组合,因子2 为Cd和Pb的组合,因子3 为Hg,因子4 为As,因子5 为Zn,因子6 为Cu,Cr和Ni、Cd和Pb 可能是同一个来源,而且这两组元素正是相关性最好的两组元素。

成份得分系数矩阵 As Cd Cr Cu Hg Ni 成份 1 -.077 .098 .573 -.054 .006 .640 2 -.104 .883 .008 -.236 -.073 -.086 3 .006 .065 -.078 -.053 1.050 .086 - 10 -

4 1.029 -.123 -.160 -.018 .005 .055 5 .002 -.498 -.043 1.057 -.228 -.302 6 -.079 -.252 -.139 -.128 -.024 -.081

  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

5.2、对于问题二: 5.2.1 极差标准化变化 5.2.1 数据极差标准化 极差标准化变换是指将一组数据变换为均值为0, 极差为1的另一组数据,*?数据x1,x2,x3....,xn的极差标准化变换为xk_xk-x,k?1,2....,n。其中RX —1n??Xk和R分别为数据x1,x2,x3....,xn的样本均差和极差. nk?1 5.2.2 研究方法——理论: 本问题采用多元统计数学方法之一的因子分析,它根据多个实测变量之间的相互关系,运用数学变换,将多个变量转变为少数几个线性不相关的综合指标,从而简化数据处理,其目的在于对大量观测数据,用较少的有代表性的因子来说明众多变量所提取的主要信息,提示出多个变量间的因果关系。 因子分析从变量的相关矩阵出发将一个m 维的随机向量X分解成低于m 个

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com