当前位置:首页 > 统计学期末复习重点
统计学期末复习重点
一.单项选择(20 X 2=40)
单选题所涉及的知识点,不用死记概念,要理解其内涵,灵活应用!
第一章. 绪论 统计的定义:统计是人们认识客观世界总体数量变动关系和变动规律的活动的总称,是认识客观世界的有力工具。
统计学的定义:统计学是关于数据的科学,研究如何收集(如调查与试验)、分析(回归分析)、表述数据(图与表),并通过数据得出基本结论。
统计的研究对象的特点:①数量性。统计数据是客观事物量的反映。②总体性。统计的数量研究是对现象总体中各单位普遍存在的事实进行大量观察和综合分析。③变异性。总体各单位的特征表现存在着差异,而且这些差异并不是事先可以预知的。
统计的分类:统计可分为描述统计,推断统计、核算统计、理论统计、应用统计 描述统计:汇总的表、图和数值。包括搜集数据、整理数据、展示数据 推断统计:用样本数据对总体性质进行估计,检验
核算统计:对国家或地区经济运行过程及各类总量进行描述和分析
总体:根据一定目的确定的所要研究的事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。 总体单位(简称单位):是组成总体的各个个体。根据研究目的的不同,单位可以是人、物、机构等实物单位,也可以是一种现象或活动等非实物单位。 样本:由总体的部分单位组成的集合。样本容量:样本所包含的总体单位数 标志(变量):总体各单位普遍具有的属性或特征。
标志的分类:①品质标志:单位属性方面的特征。品质标志的表现只能用文字、语言来描述。②数量标志:单位数量方面的特征。数量标志可以用数值来表现 几种常用的统计软件:SAS SPSS MINITAB STATISTICA Excel 思考题:1、在调查某高校学生的学习状况时,总体是( C ) A该校全部学生 B该校每个学生 C该校全部学生的学习情况
D被随机抽取进行数据采集的全部学生
2. 要了解全国的人口情况,总体单位是( A )。 A.每一个人 B.每一户 C.每个省的人口 D.全国总人口
第二章. 数据
数据:所收集、分析、汇总表述和解释的事实及数字,数据是进行统计分析研究的基础;是统计学研究对象的特征,是客观事实;不仅仅局限于数字范畴,包括非数字形式的其他信息。
个体——总体单位:收集数据的实体,也就是数据的承载者 变量(标志):个体的特征或者属性 变量值:个体在变量上的具体表现(例如,固定资产是一个变量,各企业固定资产的具体数值是变量值) 指标(统计指标):是说明总体的综合数量特征的。
标志:总体各单位普遍具有的属性或特征
指标与标志的区别:①标志是说明总体单位特征的,而指标是说明总体特征的。②指标都能用数值表示,而标志中的品质标志不能用数值表示,是用属性表示的。 连续型变量:变量的取值在数轴上连续不断,无法一一列举,即在一个区间内可以取任意实数值。(例如,气象上的温度、湿度,零件的尺寸等) 离散型变量:变量的取值是整数值,可以一一列举。(例如,企业数,职工人数) 数据的分类:
品质数据:不能用数字来表述的特征。如人的性别,民族,宗教信仰等 数量数据:用数字能够表述的特征,数值型特征,如人的身高,体重等
二者的区别:数量数据总是以数字形式表现,品质数据可以是数值型,也可以是非数值型。只有数量数据可以进行数学运算
数据的计量尺度:可分为定类尺度、定序尺度、定距尺度、定比尺度
定类变量:“名义型变量”,值只能用文字表述,说明事物是属于这一类还是属于那一类,不同类别间地位相等,没有高低优劣之分,如性别,民族,党派。 定序变量:“顺序型”变量,变量值只能用文字表述。与定类变量不同的是,定序变量的值有高低、大小、多少、优劣、强弱等方面的区分,即变量的值有顺序性。如考试成绩用优秀,良好,及格,不及格来显示,用文盲、半文盲、小学、初中、高中、大学、研究生来标记每个人的文化程度。
定距变量:变量值为数值型,对事物的准确测度,比定序尺度精确,没有绝对零点,变量值只能进行加减计算而不能进行乘除计算,如温度,公元纪年等极少数现象属于定距变量
定比变量:数据表现为“数值”对事物的准确测度,与定距尺度处于同一层次,有绝对零点,具有 ? 或 ? 的数学特性,可以进行任何形式的计算
截面数据:相同或近似相同的时间点上收集的数据,某个时间点或某瞬间事物或现象的特征情况,静态数据
时间序列数据:在几个时期或时点收集到,反映同一主体同一特征情况的数据, 动态数据
统计调查方式:统计调查方式有普查、抽样调查、典型调查、重点调查
普查:为特定目的专门组织的非经常性全面调查,通常是一次性或周期性的;一般需要规定统一的标准调查时间,应用范围比较狭窄,如人口普查,工业普查 抽样调查:从总体中随机抽取一部分单位(样本)进行调查,分重复抽样和不重复抽样,目的是推断总体的未知数字特征,遵循随机性原则,存在调查误差,并且可以加以控制,具有经济性、时效性强、适应面广、准确性高等特点
典型调查:从调查对象的全部单位中选择少数典型单位进行调查,目的是描述和揭示事物的本质特征和规律,调查结果不能用于推断总体
重点调查:从调查对象的全部单位中选择少数重点单位进行调查,调查结果不能用于推断总体,优点在于调查单位少,可以调查较多的项目和指标,了解较详细的情况。即用较少的人力和时间,取得较好的效果。组织重点调查的关键问题是确定重点单位。
调查误差:收集的数据资料与真实情况之间的差距,可分为登记性误差和代表性误差,登记性误差:由于调查者或被调查者的人为因素所造成的误差,理论上讲可以消除。代表性误差:用样本数据进行推断时所产生的误差,通常无法消除,但事先可以进行控制和计算。
组距分组步骤:①确定组数:组数的确定没有专门的规定,应以能够显示数据的
分布特征和规律为目的。建议组数:5-20组
②组限:变量值区间两端的值,上限和下限,其中上限为一个组的最大值,下限是一个组的最小值 ③确定各组组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定
注意:开口组只有一个组限,无法计算组距,开口组以相邻一组的组距作为其组距
④根据分组整理成频数分布表
组距:上限与下限之差 组距=( 最大值 - 最小值)÷ 组数 组中值:下限与上限之间的中点值 组中值=(下限值+上限值)/2
第三章. 单变量描述统计 频数——次数:对总体经过分组后形成各组单位数在各组间的分布。也就是各类别中的数据个数。
频数分布——次数分布,分布数列:总体中的各个类别及其相应的频数全部展示出来的数据集汇总表
累计频数 (P62 表3-3)
向上累计:将各组次数和比率,由变量值低的组向变量值高的组逐组累计。 向下累计:将各组次数和比率,由变量值高的组向变量值低的组逐组累计。 众数:出现次数最多的变量值。
对单项式分组数列确定众数:出现次数最多的标准值就是众数(书P63例3.2) 对组距数列确定众数:出现次数最多的组作为众数所在组 中位数:排序后处于中间位置上的值。 中位数位置的确定: (看书P65 例3.4)
NN??11中位数位置未分组数据: 中位数位置??22
ff??11(根据向上/下累计法确定中位数) ?组距分组数据: 中位数位置中位数位置??22
未分组数据的中位数的计算公式:
当N为奇数时?X??NN??11?? ???????22??? Me??e?? ?1?XN??X当N为偶数时NNN???1?1? 2?22?2?2
四分位数:把数据分为4部分,处在分位点的数值 四分位数位置的确定:
未分组数据:下四分位数位置=(N+1)/4 上四分位数位置=3*(N+1)/4
组距分组数据:下四分位数位置=N/4
上四分位数位置=3N/4
均值 (P69 例3.10)
NN
Xi?X1?X???X简单均值的计算公式为 2N12N?1X??ii? NN KKXiiFii 权均值的计算公式为 ?X1F?XF???XF2N11222NNN?1 X??ii??11KKF?F???F12N12N Fii?ii?1 ?1
第四章. 两变量描述统计
相对指标:两个有联系的指标数值对比得到的综合指标 相对指标的表现形式:无名数和有名数 无名数:抽象掉分子和分母的计量单位。表现为百分数,千分数,倍数,系数 有名数:保留分子和分母的计量单位。表现:密度
相对指标的具体形式(6种):(具体参考第四章的ppt弄懂)
总体部分数值*100%(各部分比重和为1) 结构相对数= 总体全部数值
总体中某部分数值比例相对数= (三个或三个以上的连比)
总体中另一部分数值
某一范围指标数值(横向比较,静态) 比较相对数= 另一范围的该指标数值
报告期指标数值动态相对数= *100%(随时间发展的变化,动态) 基期指标数值
某一总体的指标数值强度相对数= (两个性质不同
另一有联系而性质不同总体的指标数值
但有一定联系的总量指标之比,有名数)
实际完成数*100%(计划完成的程度) 计划完成程度相对数= 计划数
协方差:度量两个具有联合概率分布P(X,Y)的随机变量之间线性关系的指标 样本:含有n个个体,每个个体含有两个数据值(x1,y1),(x2,y2) (xi?x)(yi?y)sxy?样本协方差公式: n?1
总体协方差:变量离差乘积的数学期望
?
共分享92篇相关文档