当前位置:首页 > 数学建模中SPSS运用
1. 偏度(skewness)
g1?0,则可以认为分布是对称的;若g1>0,则认为分布有右偏态;若g1<0,认为分布有左偏态
2.峰度(kurtosis)
它以正态分布为标准,比较两侧极端数据分布的情况。对于正态分布有g2=0;若g2>0,表示数据中有较多远离均值的极端数据;若g2<0,则均值两侧极端数据较少。
1命令位置:分析\\描述统计\\频率(Frequencis)\\统计量(Statistics) 适合求分位点,一般情况下是首选命令 2.分析\\描述统计\\描述统计(Descriptive)
此命令可以完成数据的标准化,并把结果以变量的形式存放在数据文件上 Z分数一般小数可以先行转化为T分数 操作:转换(transform)?计算变量 是否服从正态分布
方法:
? 定性方法
? 观察偏度和峰度
? 画直方图
? QQ图:散点基本在直线上,可以认为服从正态分布
? 可靠方法:单样本KS检验
操作:图形->旧对话框 3.假设检验的步骤
提出原假设(零假设)H0; 确定适当的检验统计量;
计算检验统计量的值发生的概率(P值); 给定显著性水平a; 作出统计决策。 注:
必须搞清楚原假设(零假设)是什么 应该知道检验所用统计量服从什么分布 会根据软件求得的p值(sig.),作出判断 即:p<0.05,拒绝原假设;
P>0.05, 接受原假设.
4.单样本KS检验法:单样本KS检验-非参方法
操作:分析――>非参数检验――>旧对话框
5.列联表分析:判明所考察的各属性之间有无关联,即是否独立。(利用交叉表分析)
转化为一个假设检验问题,构造检验统计量卡方
1)设置权重变量! 数据\\加权个案
操作:分析->描述统计->交叉表->统计量->卡方 6.1均值比较
单样本t检验:目的:检验单个变量的均值是否与给定的常数(总体均值)之间是否存在显著差异。 要求样本来自的总体服从或近似服从正态分布。H0:总体均值和指定检验值之间不存在显著差异。
? 两独立样本t检验:目的:利用来自两个总体的独立样本,推断两个总体的均值是否存在显著
性差异;样本来自的总体服从或近似服从正态分布,H0:两总体均值之间不存在显著差异
Analyze ――>compare――>independent-sample t test――>
两配对样本t检验:根据样本数据对样本来自的两配对总体的均值是否有显著性差异进行推断。 要求: 1.两个样本应是配对的,首先两个样本的观察数目相同,其次两样本的观察值顺序不能随意改变。
2.样本来自的两个总体应服从正态分布。
操作:操作到pared-samples t test 对话框paiedvariables
7。方差分析(NAOVA):用于两个及两个以上样本均数差别的显著性检验。 方差分析中的有关术语 1. 因素或因子(factor)
所要检验的对象
要分析颜色对销量是否有影响,颜色是要检验的因素或因子 2. 水平或处理(treatment) 因子的不同表现
如,四种颜色就是因子的水平 3. 观察值
在每个因素水平下得到的样本值 每种颜色的销量就是观察值 7.1单因素方差分析
? 前提的检验:各水平下方差齐性检验
? 实现方法:option中的statistics:Homogeneity-of-variance——检验各水平下各总体方差是否齐性. 1单因素方差分析中的多重比较:目的:多重比较将对每个水平的均值逐对进行比较检验. 2几种常用的多重比较方法
1. LSD(Least significant Difference)最小显著性差异法
2.
特点:
利用了全部样本数据,而不仅是所比较的两组的数据,且认为各水平均是等方差的 与其他方法相比,其检验敏感度最高
在一定程度上克服了放大犯一类错误的问题
2. S-N-K法:运用最广泛的一种两两比较方法,采用student range分布进行所各组的组间均值的配对比较
控制了一类错误post hoc选项
如果事先无法判断方差是否具有齐性,可以考虑都选上,从结果中选择应用。Lsd法,tukey法,scheffe法,tamhane‘s t2法
1单因素方差分析步骤:分析――>比较均值――>单因素ANOVA (选项一定选方差同质性检验) 多重比较方差分析的步骤:(选两两比较中lsd选项和S-N-K) 8.相关分析与回归
8.1相关分析:0<r≤1,正。?1≤r<0,负|r|=1,两者函数关系。|r|>=0.8时,视为高度相关,0.5<=|r|<=0.8,中度相关。0.3<=|r|<=0.5时,视为低度相关。|r|<0.3时,视为不相关。 在二元变量的相关分析过程中比较常用的几个相关系数是 Pearson简单相关系数、用来衡量定距变量间的线性关系
Spearman
Kendall's tua-b等级相关系数。
Spss中的实现过程:先画散点图再做相关分析 8.2 回归分析
? 1 回归分析概述 ? 2 线性回归分析
1确定回归方程中的解释变量(自变量)和被解释变量(因变量)2确定回归方程3对回归方程
进行各种检验4利用回归方程进行预测。 2.3 线性回归方程的统计检验,
? 一、回归方程的拟合优度
2、可决系数(判定系数、决定系数)
R称为复相关系数(恰好是Pearson相关系数的绝对值), R或R2是一个从直观上判断回归方程拟合好坏的尺度,有0≤R≤1,显然R值越大,回归方程拟合越好。
一元—R2多元—调整的R2
多元回归
? 二、回归方程的显著性检验(F检验)多元回归f检验~F (p,n?p?1)利用方差分析F检验,H0:β1=β2=…=βk =0H0:β1=β2=…=βk =0,(意:回归方程不显著)
? 三、回归系数的显著性检验(t检验)
t检验,(微观分析)
H0:βj=0(即变量Xj不显著) H1:βj≠ 0 以上属于回归分析基本检验; 另有进一步检验:
如多元回归中的残差分析、多重共线性 检验等,待续… ? 四、残差分析
1残差分析包括以下内容:
2残差服从均值为零的正态分布(正态检验诊断) 3残差方差相等(方差齐性诊断)
4残差不存在自相关(残差独立性诊断) 5探测样本中的异常值(自学)
注:对于残差均值和方差齐性检验可以利用残差图进行分析。
1.残差均值为零的正态性诊断
残差的正态性诊断可以通过直方图和P-P正态概率图来实现,当P-P图基本成一直线时,正态性诊断通过。
2.残差的方差齐性诊断
通过分析标准化预测值(X轴)——学生化残差(Y轴)散点图来实现。当图中各点分布没有明显的规律性,即残差的分布不随预测值的变化而增大或减小时,(或图中各点在纵轴零点对应的直线下基本均匀分布),因此可以认为方差齐性的假设成立。 3、残差独立性诊断-常用DW检验
DW=2表示无自相关,在0-2之间说明存在正自相关,在2-4之间说明存在负的自相关。 一般情况下,DW值在1.5-2.5之间即可说明无自相关现象。 五、多元回归分析的解释变量筛选问题
变量的筛选一般有向前筛选、向后筛选、逐步筛选三种基本策略。在对话框Linear Regession分别是 Forward,Backword和Stepwise三种方法 六、多元回归分析的多重共线性分析
1容忍度:容忍度的取值范围在0-1之间,越接近0表示多重共线性越强,越接近1表示多重共线性越弱。 2方差膨胀因子VIF;方差膨胀因子是容忍度的倒数。VIF越大多重共线性越强,当VIF大于等于10时,说明存在严重的多重共线性。
? 五、多重共线性
? 3 曲线估计
回归分析小结
共分享92篇相关文档