当前位置:首页 > SPSS实验8-二项Logistic回归分析
SPSS作业8:二项Logistic回归分析
为研究和预测某商品消费特点和趋势,收集到以往胡消费数据。数据项包括是否购买,性别,年龄和收入水平。这里采用Logistic回归的方法,是否购买作为被解释变量(0/1二值变量),其余各变量为解释变量,且其中性别和收入水平为品质变量,年龄为定距变量。变量选择采用Enter方法,性别以男为参照类,收入以低收入为参照类。
(一)基本操作:
(1)选择菜单Analyze-Regression-Binary Logistic;
(2)选择是否购买作为被解释变量到Dependent框中,选其余各变量为解释变量到Covariates框中,采用Enter方法,结果如下:
消费的二项Logistic分析结果(一)(强制进入策略)
Categorical Variables Codings 收入 低收入 中收入 高收入 Frequency 132 144 155 191 240 Parameter coding (1) .000 1.000 .000 .000 1.000 (2) .000 .000 1.000 性别 男 女
分析:上表显示了对品质变量产生虚拟变量的情况,产生的虚拟变量命名为原变量名(编码)。可以看到,对收入生成了两个虚拟变量名为Income(1)和Income(2),分别表示是否中收入和是否高收入,两变量均为0时表示低收入;对性别生成了一个虚拟变量名为Gedder(1),表示是否女,取值为0
时表示为男。
消费的二项Logistic分析结果(二)(强制进入策略)
Block 0: Beginning Block Classification Table a,b Step 0 Observed 是否购买 不购买 购买 Overall Percentage a. Constant is included in the model. b. The cut value is .500 Predicted 是否购买 不购买 269 162 购买 0 0 Percentage Correct 100.0 .0 62.4 分析:上表显示了Logistic分析初始阶段(第零步)方程中只有常数项时的错判矩阵。可以看到:269人中实际没购买且模型预测正确,正确率为100%;162人中实际购买了但模型均预测错误,正确率为0%。模型总的预测正确率为62.4%。
消费的二项Logistic分析结果(三)(强制进入策略)
Variables in the Equation B S.E. Wald df Sig. Exp(B) Variables in the Equation Step 0 Constant B -.507 S.E. .099 Wald 26.002 df 1 Sig. .000 Exp(B) .602
分析:上表显示了方程中只有常数项时的回归系数方面的指标,各数据项的含义依次为回归系数,回归系数标准误差,Wald检验统计量的观测值,自由度,Wald检验统计量的概率p值,发生比。由于此时模型中未包含任何解释变量,因此该表没有实际意义。
消费的二项Logistic分析结果(四)(强制进入策略) Variables not in the Equation Step 0 Variables age gender(1) income income(1) income(2) Score 1.268 4.667 10.640 2.935 10.640 18.273 df 1 1 2 1 1 4 Sig. .260 .031 .005 .087 .001 .001 Overall Statistics
分析:上表显示了待进入方程的各个变量的情况,各数据项的含义依次为Score检验统计量的观测值,自由度和概率p值。可以看到,如果下一步Age进入方程,则Score检验统计量的观测值为1.268,概率p值为0.26。如果显著性水平a为0.05,由于Age的概率p值大于显著性水平a,所以是不能进入方程的。但在这里,由于解释变量的筛选策略为Enter,所以这些变量也被强行进入方程。
消费的二项Logistic分析结果(五)(强制进入策略)
Block 1: Method = Enter Omnibus Tests of Model Coefficients Step 1 Step Block Model Chi-square 18.441 18.441 18.441 df 4 4 4 Sig. .001 .001 .001
分析:上表显示了Logistic分析第一步时回归方程显著性检验的总体情况,各数据项的含义依次为似然比卡方的观测值,自由度和概率p值。可以看到,在本步所选变量均进入方程(Method=Enter)。与前一步相比,似然比卡方检验的观测值18.441,概率p值为0.001。如果显著性水平a为0.05,由于概率p值小于显著性水平a,应拒绝零假设,认为所有回归系数不同时为0,解释变量的全体与Logit P之间的线性关系显著,采用该模型是合理的。
在这里分别输出了三行似然比卡方值。其中,Step行是本步与前一步相比的似然卡方比;Block行是本块(Block)与前一块相比的似然卡方比;Model行是本模型与前一模型相比的似然卡方比。在本例中,由于没有设置解释变量块,且解释变量是一次性强制进入模型,所以三行结果都相同。
消费的二项Logistic分析结果(六)(强制进入策略)
Model Summary Cox & Snell R Step 1 -2 Log likelihood 552.208 aNagelkerke R Square .057 Square .042 a. Estimation terminated at iteration number 4 because parameter estimates changed by less than .001.
共分享92篇相关文档