当前位置:首页 > 概率论
15.63
即样本均值为15.4405,样本中位数为15.46,样本的0.25分位数为15.355,样本的0.75分位数 15.56, 样本的0.05分位数是15.13, 样本的0.95分位数是15.63.
输入
Variance[data1] (*求样本方差s2*)
StandardDeviation[data1] (*求样本标准差s*) VarianceMLE[data1] (*求样本方差s*2*)
StandardDeviationMLE[data1] (*求样本标准差s?*) SampleRange[data1] (*求样本极差R*)
则输出
0.020605 0.143544 0.0195748 0.13991 0.56
即样本方差s2为0.020605, 样本标准差s为0.143544, 样本方差s*2为0.0195748 样本标准 差s*为0.13991, 极差R为0.56.
注: Variance给出的是无偏估计时的方差, 其计算公式为
1ni?(xn?1i?1n?x)2, 而 ,它比前者稍
VarianceMLE给出的是总体方差的极大似然估计, 其计算公式为微小些.
输入
1?(xni?1i?x)2CoefficientOfVariation[data1]
(*求变异系数.变异系数的定义是样本标准差与样本均值之比*)
则输出
0.00929662
输入
CentralMoment[data1,2](*求样本二阶中心矩*) CentralMoment[data1,3] (*求样本三阶中心矩*) CentralMoment[data1,4] (*求样本四阶中心矩*)
输出为
0.0195748 -0.00100041 0.000984863
输入
Skewness[data1]
(*求偏度,偏度的定义是三阶中心矩除以标准差的立方*)
Kurtosis[data1]
(*求峰度,峰度的定义是四阶中心矩除以方差的平方*)
则输出
-0.365287 2.5703
上述结果表明:数据(data1)的偏度(Skewness)是-0.365287,负的偏度表明总体分布密度有 较长的右尾,即分布向左偏斜.数据(data1)的峰度(Kurtosis)为2.5703. 峰度大于3时表明总体 的分布密度比有相同方差的正态分布的密度更尖锐和有更重的尾部. 峰度小于3时表明总体 的分布密度比正态分布的密度更平坦或者有更粗的腰部.
输入
ZeroMean[data1]
(*把数据中心化,即每个数据减去均值*)
则输出
{-0.1605,0.1895,-0.3105,0.0195,-0.0405,0.1195,-0.0905, 0.1195,-0.0605,-0.2305,0.0395,0.1395,0.1295,-0.0805, 0.0395,0.0195,0.0795,-0.1505,-0.0205,0.2495}
输入
Standardize[data1](*把数据标准化,即每个数据减去均值,再除以标准差,从而使
新的数据的均值为0,方差为1*)
则输出
{-1.11812,1.32015,-2.16309,0.135846,-0.282143,0.832495,
-0.630467,0.832495,-0.421472,-1.60577,0.275176,
0.971825,0.90216,-0.560802,0.275176,0.135846,
0.553836,-1.04846,-0.142813,1.73814}
读者可验算上述新数据的均值为0,标准差为1.
作样本的直方图
例2.2 从某厂生产的某种零件中随机抽取120个, 测得其质量(单位:g)如表2-1所示. 列出分组表, 并作频率直方图.
表2-1
200 202 203 208 216 206 222 213 209 219 216 203 197 208 206 209 206 208 202 203 206 213 218 207 208 202 194 203 213 211 193 213 208 208 204 206 204 206 208 209
213 203 206 207 196 201 208 207 213 208
210 208 211 211 214 220 211 203 216 221 211 209 218 214 219 211 208 221 211 218 218 190 219 211 208 199 214 207 207 214 206 217 214 201 212 213 211 212 216 206 210 216 204 221 208 209 214 214 199 204 211 201 216 211 209 208 209 202 211 207 220 205 206 216 213 206 206 207 200 198
输入
< data2={200, 202, 203, 208, 216, 206, 222, 213, 209, 219, 216, 203, 197, 208, 206, 209, 206, 208, 202, 203, 206, 213, 218, 207, 208, 202, 194, 203, 213, 211, 193, 213, 208, 208, 204, 206, 204, 206, 208, 209, 213, 203, 206, 207, 196, 201, 208, 207, 213, 208, 210, 208, 211, 211, 214, 220, 211, 203, 216, 221, 211, 209, 218, 214, 219, 211, 208, 221, 211, 218, 218, 190, 219, 211, 208, 199, 214, 207, 207, 214, 206, 217, 214, 201, 212, 213, 211, 212, 216, 206, 210, 216, 204, 221, 208, 209, 214, 214, 199, 204, 211, 201, 216, 211, 209, 208, 209, 202, 211, 207, 220, 205, 206, 216, 213, 206, 206, 207, 200, 198}; 先求数据的最小和最大值.输入 Min[data2] Max[data2] 得到最小值190,最大值222.取区间[189.5,222.5],它能覆盖所有数据.将[189.5,222.5]等分为11 个小区间,设小区间的长度为3.0.数出落在每个小区内的数据个数,即频数fi(i?1,2,?,7),这 可以由BinCount命令来完成. 输入 f1=BinCounts[data2,{189.5,222.5,3}] 则输出 {1,2,3,7,14,20,23,22,14,8,6} 输入 gc=Table[189.5+j*3-1.5,{j,1,11}] (*产生11个小区间的中心的集合gc*) bc=Transpose[{f1/Length[data2],gc}] (*Length[data2]为数据data2的总个数即样本的容量n, f1/Length[data2]为频率fi/n,Transpose是求矩阵转置的命令, 这里bc为数据对,第一个数是频率,第二个是组中心*) 则输出结果 {{{1120,191.},{160,194.},{140760,197.},{,215.},{7120115,200.},{120760,203.},{16,206.},23120,209.},{1160 ,212.},{,218.},{,221.}}输入作频率fi/n对组中心的条形图命令 BarChart[bc] 则输出所求条形图(图2-2). 0.150.10.05191.194.197.200.203.206.209.212.215.218 图2-2 实验习题 1.在某省一“夫妻对电视传播媒介观念的研究”项目中,访问了30对夫妻,其中丈夫所 受教育x(单位:年)的数据如下: 18,20,16,6,16,17,12,14,16,18,14,14,16,9,20,18,12,15,13,16,16,21,21,9,16,20,14,14,16,16 (1) 求样本均值、中位数、四分位数;样本方差、样本标准差、极差、变异系数,二阶、 三阶和四阶中心矩;求偏度、峰度。 (2) 将数据分组,使组中值分别为6,9,12,15,18,21作出x的频数分布表; 作出频率分布的 直方图. 2.下面列出84个伊特拉斯坎男子头颅的最大宽度(单位:mm),对数据分组,并作直方图. 141 148 132 138 154 142 150 146 155 158
共分享92篇相关文档