当前位置:首页 > 王静龙《非参数统计分析》(1-6章)教案
根据上述资料确定四分位数步骤如下: (1)向上累计方式获得四分位数位置: Q1的位置=(∑f +1)/4=(164+1)/4=41.25 Q2的位置=2(∑f +1)/4=2(164+1)/4=82.5 Q3的位置=3(∑f +1)/4=3(164+1)/4=123.75 (2)可知Q1,Q2,Q3分别位于向上累计工人数的第三组、第四组和第五组,日产量四分位数具体为: Q1=L1+■×d1=70+■×10=72.49(千克) Q2=L2+■×d2=80+■×10=80.83(千克) Q3=L3+■×d3=90+■×10=90.96(千克) shitouwa4320 2014-10-23
§2.2.3 标准误
假设产生数据的总体的均值为?,方差为?2。它们的估计分别为样本平均值x, 样本方差S2和样本标准差S,由于平均数x的标准差为?为Sn,Sn称为标准误。
n,所以它的估计取
x??x??~N(0,1)得~t(n?1) 由
?nSn在显著性水平0.95的条件下,得置信区间的端点
x????t0.975(n?1) SnSt0.975(n?1). 即得 ??x?nt0.975(11)?2.2010
用Mintab计算得到:
Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3 Maximum
C1 12 0 1940.0 49.3 170.6 1700.0 1857.5 1905.0 2025.0 2340.0
算得到所求置信区间为:
??1940?49.3?2.20986273?1940?108.5086233
用Excel计算得到:
平均 标准误差 中位数 众数 标准差 方差 峰度 偏度 区域 最小值 最大值 求和 观测数 置信度(95.0%)
1940 49.25198
1905 1880 170.6139 29109.09 1.874516 1.102987
640 1700 2340 23280 12 108.4029
所求置信区间为:
??1940?49.25198042?2.20986273?1940?108.4029328
两款软件计算结果相差不大。 §2.2.4 偏度
偏度(Skewness)反应单峰分布的对诚性,总体偏度用?s表示
?3?X????]?3 ?s?E[?????样本偏见度用bs表示,国家标准的计算公式为: bs?j3m3?m2?32
其中mj??i?1n?x?x?,inj?2,3.
在Excel中的计算公式为:
m3n bs?(n?1)(n?2)?S?3
一般bs?0数据的分布是右偏的,bs?0数据的分布是左偏的,bs?0
我们倾向于认为总体的分布是对称的。 §2.2.4 峰度
峰度(Kurtosis)反映峰的尖峭程度,总体峰度用?k表示,总体的峰度的定义为(国家标准)
?4?X?????E[]??? k
?4???样本峰度用bk,国家标准的计算公式为
4m4 bk??m2?2
由于正态分布的峰度系数为3,当 平分布。
bk?3时为尖峰分布,当 bk?3 时为扁
第三章 符号检验法
符号检验是一种较为简单的非参数检验,中位数检验是符号检验的一个重要应用。
例3.1 某市劳动和社会保障部门的资料说明,1998年高级技师的年收入的中位数为21700元,该市某个行业有一个由50名高级技师组成的样本,数据如下: 23072 24370 20327 24296 22256 19140 25669 22404 26744 26744 23406 20439 24890 24815 24556 18472 24514 22516 25112 23480 26552 24074 18064 22590 ????? 原假设与备择假设为:
H0:me?21700
H1:me?2170
,2,?,n},S即为大于中位数me0的 选择统计量 S?{xi:xi?me0?0,i?1?#?
xi的个数,\#\表示计数,S?也可表示为:
?1xi?me0?0 S??ui,ui??
0其他i?1??n1若H0:me?2170为真,则S~b(n,)
2?而n?50,检测值S?32
??50??1?计算P值P(X?32)????i???2??0.032454?0.05
i?32????5050即检测值S?32落入拒绝域。
故拒绝原假设,接受备择假设H1:me?2170
?在excel中如何使用BINOMDIST函数返回一元二项式分布的概率值
BINOMDIST函数用于返回一元二项式分布的概率值。
函数语法
语法形式BINOMDIST(number_s,trials,probability_s,cumulative)
number_s:表示实验成功的次救。 trials:表示独立实验的次数。
probability_s:表示一次实验中成功的概率。
cumulative:表示一逻辑值,决定函数的形式,如果cumulative为TRUE,函数BINOMDIST返回积累 分布函数,即至多number_s次成功的概率;如果为FALSE,返回概率密度函数,即number_s次成功 的概率。
例如,抛硬币正反面的概率是0.5若要计算出抛10次硬币6次是正面的概率。可以使用BINOMDIST函数 来实现。
Step01选中C4单元格,在公式编辑栏中输入公式: =BINOMDIST(A2,B2.C2,TRUE)
共分享92篇相关文档