当前位置:首页 > Stata简明讲义
Stata简明讲义 中国经济研究中心 王非
但是,当按照上述方法打开另一个数据文件“c04adult.dta”时(该文件为中国健康和营养调查的2004年的成人数据。因为太大,没有和讲义附在一起),显示界面中出现了红色的错误信息:
这几行提示告诉我们,没有足够的空间容纳数据;此外,还给出了三种可行的方案:1、更有效地存储和压缩数据,2、删掉某些变量或观测值,3、增大分配给该数据的空间。一般来说,我们选择第3种方案。毕竟,许多人不愿意“委屈”菜的质量和分量,那就换口大锅吧。
“换大锅”的命令是:set memory xxM。其中的“xx”为一个数字,代表分配给数据多大的空间;“M”为存储容量的单位,即兆字节。Stata默认的分配空间是1M。接下来,我分配给这个大数据10M的空间。分配完毕后,就可以顺利打开数据了:
8
Stata简明讲义 中国经济研究中心 王非
到此为止,我们已经知道怎样把dta格式的数据文件导入Stata了。但是,对于许多不是dta格式的数据文件,我们应该怎么办?
对于后缀名是“raw”, “txt”和“csv”的数据,Stata可以用“insheet using”命令导入。这个命令的用法和“use”类似。对于那些可以另存为这三种格式的数据,可以先把它们转化成这三种格式,然后用“insheet using”命令导入。讲义附带着一个Excel文件“wage1_sub.xls”,是“WAGE1.dta”的子样本。打开这个Excel文件,另存为“txt”(制表符分隔的文本文件)或“csv”格式后,可以用“insheet using”命令导入。一般来说,在导入非“dta”格式的数据后,要把这些数据另存为“dta”格式。因此,在do文件的“insheet using”命令的下一行,最好紧跟“save”命令。一般的命令是“save *.dta”,“*”代表另存为的文件名。如果不加“.dta”,Stata默认的存储格式为“dta”。此外,如果想保存对数据的任何改动,也要使用“save”命令。
当源数据是Excel数据的时候,我们还可以将其直接复制粘贴到Stata里。以“WAGE1_sub.xls”为例:1、打开“WAGE1_sub.xls”,用鼠标选定包括变量名
9
Stata简明讲义 中国经济研究中心 王非
在内的全部数据内容,并复制;2、用clear命令清空Stata内的原有数据,然后点击菜单栏中的
图标,将光标放在左上角的那个格子中,然后粘贴。操作完
毕后,我们会看到:
这个大框是数据编辑框,除了点击
图标之外,还可以直接输入edit命令打开。
中间的白色区域就是源文件中的所有数据,每一行为一个观测值(一个人),每一列为一个变量;白色区域左边是观测值的序号,从1到100;白色区域的上边是变量名称。我们发现,在复制粘贴的过程中,原来Excel文件中的变量名称自动跑到了数据编辑框中它应当所在的位置。要达到这样的效果,变量名就不能用汉字表示。
此外,还可以用专门的数据格式转化软件(比如StatTransfer)将其他格式的数据转化成可以直接导入Stata的格式。StatTransfer可以转化的数据格式有许多:Access数据、ASCII数据、Excel数据、Gauss数据、Matlab数据、Minitab数据、SAS数据、SPSS数据、Statistica数据和Stata数据等,基本上涵盖了常见的数据
10
Stata简明讲义 中国经济研究中心 王非
格式。该软件的使用比较简单,这里就不再赘述了。大家可以试着将“WAGE1_sub.xls”转化成dta格式。
最后,如果要一条一条地录入数据,可以直接在数据编辑框中录入(但我建议先用Excel等比较方便的软件录入,然后再导入Stata)。
在数据导入的过程中,还可能出现其他问题,这需要大家开动脑筋,灵活解决。在数据导入之后,请大家务必要对照一下源数据,看看导入的数据和源数据是否一致,是否出现了诸如串行或串列的问题。
四、Stata命令中的倚天剑和屠龙刀
把数据导入Stata之后,接下来就是复杂的数据分析和处理工作了。这一工作需要浩如烟海、变化多端的命令,而这往往使初学者畏而却步。其实,毫不夸张地说,只要掌握了Stata命令中的倚天剑和屠龙刀,就可以畅行江湖了。这两条最重要的命令是:help和search。
当你确切地知道某个命令的名称,但却不太清楚它的用法时,就用help命令;当你只是模糊地知道某个命令时,就用search命令。下面以简单的线性回归命令为例。
最简单的线性回归命令是regress。如果你知道regress这个命令,但是不知道它的用法,可以输入如下命令:help regress。然后,Stata会跳出一个框,对这个命令进行详细说明(即该命令的帮助文件)。如果你不知道这个命令,但是你知道你想做OLS,可以输入如下命令:search ols。然后,Stata会给出它认为和“ols”这个关键词比较相关的命令及简要的说明:
11
共分享92篇相关文档