云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 因子分析在STATA中实现和案例

因子分析在STATA中实现和案例

  • 62 次阅读
  • 3 次下载
  • 2025/5/7 10:18:26

分解释了全部六个变量组合的方差还多。不重要的第2 到6个主成分在随后的分析中可以放心地省略去。

运行factor命令后,我们可以接着运行screeplot命令画出碎石图。碎石图中特征值等于1处的水平线标示了保留主成分的常用分界点,同时再次强调了本例中的成分3到成分6并不重要。

Scree plot of eigenvalues after factor4Eigenvalues0112323Number456 碎石图

检验的方法还是跟上一章的主成分分析一样,由于我们都是选用实际的数据来进行分析,所以在一般情况下,检验都是通得过的,可以忽略,觉得有需要的再进行检验。

旋转会进一步简化因子结构。在提取因子之后,键入rotate命令进行旋转。

Factor analysis/correlation Number of obs = 31 Method: principal factors Retained factors = 3 Rotation: orthogonal varimax (Kaiser off) Number of params = 15

-------------------------------------------------------------------------- Factor | Variance Difference Proportion Cumulative -------------+------------------------------------------------------------ Factor1 | 2.90489 0.67214 0.5801 0.5801 Factor2 | 2.23276 2.19228 0.4459 1.0260 Factor3 | 0.04047 . 0.0081 1.0341 -------------------------------------------------------------------------- LR test: independent vs. saturated: chi2(15) = 211.52 Prob>chi2 = 0.0000

Rotated factor loadings (pattern matrix) and unique variances

----------------------------------------------------------- Variable | Factor1 Factor2 Factor3 | Uniqueness -------------+------------------------------+-------------- x1 | 0.9659 0.0601 0.1284 | 0.0469 x2 | 0.2269 0.8399 0.1052 | 0.2320 x3 | 0.9585 0.1143 -0.0844 | 0.0611 x4 | 0.9708 0.1546 -0.0211 | 0.0332 x5 | 0.2236 0.8940 -0.0362 | 0.1494 x6 | -0.0962 0.8291 -0.0635 | 0.2993 -----------------------------------------------------------

Factor rotation matrix

----------------------------------------- | Factor1 Factor2 Factor3 -------------+--------------------------- Factor1 | 0.8578 0.5138 0.0115 Factor2 | -0.5137 0.8579 -0.0135 Factor3 | 0.0168 -0.0056 -0.9998 -----------------------------------------

结合实际情况,我们通过上面的分析整理出前两个主因子的正交因子表。

表:正交因子表 因 子 指 标 x1 x2 x3 x4 x5 x6 Factor 1 0.9659 0.2269 0.9585 0.9708 0.2236 -0.0962 Factor 2 0.0601 0.8399 0.1143 0.1546 0.8940 0.8291 根据上表将六个指标按高载荷分成两类,并结合专业知识对各因子命名,如下表:

表:高载荷分类 1 2 高载荷指标 人均GDP 城镇居民人均年可支配收入 农村居民家庭人均纯收入 高等学校数 卫生机构数 新增固定资产 因子命名 收入因子 投资、社会因子 接着进行一个后续因子分析的制图命令loadingplote有助于将其可视化。从图中我们就可以直观的看出在主因子1中x1、x3、x4明显取得较大值,而对于主因子2则是x2、x5、x6取得较大的值。

载荷图

Factor loadings1x6x5x2Factor 2.2.4.6.8x4x3x100Rotation: orthogonal varimaxMethod: principal factors.5Factor 11

因子分是通过将每个变量标准化为平均数等于0和方差等于1,然后以因子分系数进行加权合计为每个因子构成的线性组合。基于最近的rotate或factor结果,predict会自动进行这些计算。通过命令predict f1 f2,我们得到了各个观察变量的主因子1、主因子2的得分情况。

. list area f1 f2

+--------------------------------+ | area f1 f2 | |--------------------------------| 1. | 北 京 2.561218 -.3716789 | 2. | 天 津 1.557873 -.9623399 | 3. | 河 北 -.3308641 1.11135 | 4. | 山 西 -.4196471 -.1267554 | 5. | 内蒙古 .0597282 -.493462 | |--------------------------------| 6. | 辽 宁 .0589154 1.03599 | 7. | 吉 林 -.1869884 -.0693724 | 8. | 黑龙江 -.3388027 .0518705 | 9. | 上 海 3.102133 -.8749663 |

10. | 江 苏 .7713872 1.864629 | |--------------------------------| 11. | 浙 江 1.640963 .5580102 | 12. | 安 徽 -.5925296 .5026094 | 13. | 福 建 .5376554 -.3128498 | 14. | 江 西 -.445243 .2467043 | 15. | 山 东 .1589503 1.588749 | |--------------------------------| 16. | 河 南 -.4744598 1.084772 | 17. | 湖 北 -.4194019 .7986803 | 18. | 湖 南 -.4611212 .8609527 | 19. | 广 东 .6425342 1.33433 | 20. | 广 西 -.5491737 -.1288966 | |--------------------------------|

21. | 海 南 -.2889173 -1.39015 | 22. | 重 庆 -.3183038 -.6323313 | 23. | 四 川 -.652319 .9108785 | 24. | 贵 州 -.9411649 -.6618432 | 25. | 云 南 -.7608307 -.2586383 | |--------------------------------| 26. | 西 藏 -.6072451 -1.569231 |

. summarize f1 f2

27. | 陕 西 -.7326311 .1913275 | 28. | 甘 肃 -.9497479 -.5987777 | 29. | 青 海 -.6269016 -1.50444 | 30. | 宁 夏 -.4114082 -1.422286 | |--------------------------------| 31. | 新 疆 -.5836563 -.7628338 | +--------------------------------+

Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- f1 | 31 -4.09e-09 .988557 -.9497479 3.102133 f2 | 31 9.13e-09 .9464783 -1.569231 1.864629

在这些因子分之间是存在着相关,在默认选项中,promax旋转允许因子分之间存在相关。通过运行命令correlate f1 f2可得。从运行出来的结果看到,两个因子分相关关系是很小的。

. correlate f1 f2 (obs=31)

| f1 f2 -------------+------------------ f1 | 1.0000

f2 | 0.0158 1.0000

另一个后因子分析制图命令,scoreplot可绘出这些观测案例的因子分的散点图。在本例的得分图中,我们可以看到,上海、北京、浙江、天津这些城市的主因子1的得分相对于其他城市高,因为主因子1是收入因子,这些城市的收入在全国是排在前列的。而我们可以看到北京、上海的在主因子2(即投资、社会因子)的得分是较低,这是因为这两个城市的经济总量相对较小。在江苏、山东、广东这些经济总量名列前茅的省份,它们的主因子2的得分也是相应位于其他城市前面。

得分图

搜索更多关于: 因子分析在STATA中实现和案例 的文档
  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

分解释了全部六个变量组合的方差还多。不重要的第2 到6个主成分在随后的分析中可以放心地省略去。 运行factor命令后,我们可以接着运行screeplot命令画出碎石图。碎石图中特征值等于1处的水平线标示了保留主成分的常用分界点,同时再次强调了本例中的成分3到成分6并不重要。 Scree plot of eigenvalues after factor4Eigenvalues0112323Number456 碎石图 检验的方法还是跟上一章的主成分分析一样,由于我们都是选用实际的数据来进行分析,所以在一般情况下,检验都是通得过的,可以忽略,觉得有需要的再进行检验。 旋转会进一步简化因子结构。在提取因子之后,键入rotate命令进行旋转。 Factor analysis/correlation

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com