当前位置:首页 >> 金融/投资 >>

stata统计分析与应用笔记

第一章:Stata 概述:help 和 search 都是查找文件的命令但 help 用
于查找精确的命令,search 是模糊查找。还可使用 help|contents 来分类查找

第二章:数据管理:
2.1 变量和变量的取值:
1.变量的命名:不能以数字开头,区分大小写,不能命名为系统变量名 2.变量的取值类型: (1)字符型:字符变量存储格式是 str?,str 表示格式?表示该变量的存储最多可容纳的字 符数 (2)数值型数据:存储格式:byte.int.long.float.double.Stata 默认将数字存储为浮点 数据,而将计算结果存为双浮点数据。 (3)缺失数据:一般仅用“.”表示 3.变量的显示: (1)数值变量的显示格式: a.普通格式有%w.dg, %w.dgc(g 表示普通,w 表示整个显示所占的字符数,d 表示显示的数 字中小数点后的位数,c 是要求 Stata 给出带逗号 “,”数字显示格式如 12345 显示为 12, 345) b.固定格式有%w.df, %w.dfc(f 表示固定) c.科学指数法格式:%w.de, (e 表示科学计数) (2)字符变量的显示格式:仅有一种%?s,%是提示符,#表示显示字符数,s 表示字符变量 显示格式,默认右对齐,后加“-”可改为左对齐。 (3)使用 format 命令变量显示格式:format varlist %fmt 或者 format %fmt varlist 4.变量的标签 (1)添加数据集的标签使用: label data [“lable”] (2)添加变量的标签使用:label variable varname [“lable”] (3)label 为变量数值添加标签的语法有两部分, 先定义数值标签:label define lblname#“lable” [#“lable”](lblname 是标签名称) 然后将定义好的数值标签添加到变量上:label values varlist [lblnamel.]

2.2 创建一个新的数据集
1.关于数据集操作的基本命令 (1)browse 和 edit 命令:browse 用于打开数据浏览器,edit 命令用于打开数据编辑器 Edit [varlist] [if] [in] browse [varlist] [if] [in](if 和 in 用于选择需要的子集) (2)rename:rename old_varname new_varname (3)save 命令:save [filename] [,save_options]([,save_options]可以指 nolabel(不 保存设定标签),replace(允许新文件覆盖原文件),all 主要用于编程 (4)describe:用于产生一个对数据集的简明总结 格式: describe [varlist] [,memory_options] (命令选项: simple,short,detail,fullnames) (5)list:用于显示变量的数值,其后可以跟需要显示的变量名称 语法:list [varlist] [if] [in] [,options] (命令选项包括:noobs(不显示观测值的数值),clean,separator,sepby,nolabel)

(6)codebook:用于详尽地描述变量的内容,包括变量名称、标签、赋值。 语法:codebook [varlist] [if] [in] [,options] (命令选项有 header,notes,mv,problems,compact) 2.举例应用:输入原始数据?定义变量名?添加标签?使用 describe 和 codebook 命令查 看数据全貌?保存数据到硬盘的工作目录

2.3 导入已创建的数据集
1.一般原则: (1)打开数据集前要用 clear 命令清除内存中的数据集 (2)可用 set memory 50m,permanently 来设定空间 (3)读入数据方法:可用 use, edit, insheet,infile,infix,等 (4) 在数据文件不是太大的情形下, 使用 Excel 文件粘贴复制就可以完成数据 读入 2.读取格式为.dta 的数据 一般:use filename [,clear nolabel]( clear nolabel 是两个选项)此时 filename 为当 前工作目录下的文件 3.利用 Excel 复制数据进入 Stata 系统中

2.4 Stata 中的表达式
1.算术符号:+ 、-、*、/、^(乘方) 、-(负号) 2.关系符号(六种) :==(等于) ,!=(不等于),> , < , >= , <= 3.逻辑符号:!(或),&(且) , “|” (非)

2.5 Stata 中的常用函数 2.6 使用 in、if 和 by 语句定义数据子集
许多命令都可以限制为对数据的个子集执行,这就需要在命令中加上 in 或者 if 选择条件 1.in 的语法:command in range (command 是命令,range 可以是数字#,也可以是从某 数字到另一个观测值“#/#”或者从某个数字到最后“#/1” ,以及从开始到最后“f/#” 2.if 的语法:command if exp (exp 是需要满足的表达式) 3.by 语句的使用:大多数 Stata 命令都允许使用 by 前置语句,用来对某些变量具有相同 赋值的样本子集重复执行命令, by 的语法:by varlist:Stata_cmd bysort varlist:Stata_cmd (Stata_cmd 表示要执行 的命令,bysort 和 by 本质相同,只不过前者先对 varlist 排序再分组,一般用 bysort

2.7 变量的相关操作
1.建立新的变量 generate generate 语法:generate [type] newva=exp[if] [in] (type 是可选项用于指定创建的变量的类型,newva 是新变量名称,exp 是赋值表达式 注意: (1)一定要区分“=”和“==” (2)生成新变量中往往会产生缺失值 2.更改已有的变量 replace Replace 的语法:replace oldvar =exp[if] [in] [,nopromote] 选项 nopromote 阻止 Stata 改变变量的类型来适应新的赋值,较少使用

3.egen 命令 egen 表示对 generate 命令的扩展,它有自己一系列用于完成 generate 命令无法轻易完成 的函数 egen 语法:egen [type] newvar =fcn(arguments) [if] [in] [,options] (fcn 是 egen 命令中特有的函数,arguments 表示表达式、变量名或者数字列表,它们依函 数而定,选项也依函数而定

2.8 数值和字符串的转换
1.encode 和 decode 命令 encode 命令可为已经存在的字符串变量添加一个去了标签的数值型变量 decode 命令可以根据一个数值型变量和它的标签生成一个字符型变量, 字符型到数值型变量语法:encode varname [if] [in],generate(newvar) [label (name)] Varname 表示要进行转换的变量,newvar 表示要生成的新变量,label (name)是指定新变量 的标签名,没有的话,默认与原变量相同 数值型到字符型变量语法: decode varname [if] [in],generate(newvar) [maxlength (#)] maxlength (#)用来指定新生变量的长度 2.real 函数 real()用于从合适的字符串表达式中得到数值, 如 real(“5.2”)+1=6.2 如果字符串中不含 数字则返回“.”

2.9 生成分类变量和虚拟变量
1.生成虚假变量 虚拟变量的取值非此即彼,如 female=1 表示男性,female=0 表示女性 (1) 使用 generate 和 replace 生成虚拟变量, 如: use wage ,replace gen college=0 replace college=1 if educ>=12 list educ college in 1/10 (2) 使用 generate newvar=(varname>#)生成虚拟变量 generate newvar=(varname>#)是一个生成虚拟变量的快捷方式,在这个命令中,第 一个等号表示定义:满足其后小括号中的观测案例将会在新的变量中定义为 1,其 余的情况则定义为 0 上(1)有程序?generate college=(educ>=12) 2.生成分类变量 (1)generate 加 replace 命令生成分类变量 如将 edu6 教育水平划分为 6 个等级,和虚拟变量不同之处在于这是 6 组 (3) recode 命令 recode 类似 replace 也可对已有变量重新赋值,语法如下: recode varlist (rule)[(rule)?][,generate(newvar)] (varlist 是 需 要 进 行 转 换 赋 值 的 变 量 名 , rule 是 事 先 确 定 的 转 换 规 则 , 选 项 [,generate(newvar)]用于将转换后的变量保存为一个新的变量 recode 的常见赋值规则有#=#,##=#,#/#=#,nonmissing=#,minssing=# 如:recode x1(1=2)(2=1),gen(nx1)

3.使用 autocode()、recode()和 group()3 个函数生成分类变量 语法:gen varlist =autocode(x,n,xmin,xmax) gen varlist =group(x) gen varlist =autocode(x,x1 , x2 , … , xn )

2.10 数据的整理 (将存放在不同的数据文件里的数据文件合并)
1.数据的横向合并:指将两个数据文件的变量加总在一起。合并后数据的样本不变,但变量 的数目增加了,也就是使得数据文件变宽了。用 merge 命令语法: merge [varlist] using filename [filename?] [,options] varlist 指的是合并序号变量,[filename?]用于合并两个以上的数据,易出错。 Options 选项可以有:merge(newvar),update,replace,nokeep,nosummary 2.数据的纵向合并:指的是把两个数据的样本加总在一起,合并后的数据变量数目不变,但 样本数目增加了,也就是使得数据变长了。用 append 命令语法: append using filename [,options] (选项有 keep,nolabel,nonotes) 3.数据的交叉合并: 指的是把一个数据的个案和另外一个数据的个案交叉搭配生成新的数据。 (1)用 jobby 进行组内交叉 语法:joinby [varlist] using filename [,options] (2)用 cross 进行一一交叉 语法:cross using filename 4.数据的抽取:对于大型数据,需抽取再分析 sample 命令:sample # [if] [in] [,count by(groupvars)] #是样本容量(或样本百分比) ,如果指定 count,那么#就是样本内观测值个数;如果没有 指定 count,那么#就是抽取样本的百分比。by(groupvars)可进行组内抽取,还可以用 set seed 5 来保证每次抽取的样本相同

第三章

图形绘制基础

3.1 Stata 绘图简介
用户可用 Graphics 菜单制图,但不推荐。 1. 主要的图形类型:直方图、扇形图、条形图、散点图、直线图以及数据拟合图(一维或 二维图) ,还可绘如盒形图,长钉图,圆点图、面积图以及其他常见图。 2. 图形的组成部分与制图命令的结构 3. 寻求帮助:help graph

3.2 绘制散点图
1. 绘制散点图的命令和最基本的使用:语法如下 [twoway] scatter varlist [if] [in] [weight] [,options] 以下三种也可识别 scatter 语句 graph twoway scatter ? twoway scatter ? scatter ? 如果命令后紧跟两个变量名,则 Stata 会默认第一个为 y 轴变量,第二个为 x 轴变量; 如果命令后有两个以上的变量,那么 Stata 会将除最后一个以外的变量作为 y 轴变量, 而将最后一个变量当成 x 轴变量。scatter 命令是 graph twoway(二维绘图命令)中最基 本的一个,其它的都是在散点图的基础上进行的。 Scatter 绘图还可以与其他类型二维制图命令放在一起,绘制重叠的复合图形比如:

twoway (scatter?)(line?)(lfit?)?scatter ?||line?||lfit..||? 2. 散点显示选项的设定:包括形状、颜色、大小 3. 散点标签选项:散点标签一般是指位于每个散点旁的用于说明散点所代表个体的文字。 4. 连线选项的设定:用来设定如何用线将散点图上各点连接起来,这样可以更加清楚地看 变动的趋势 5. 振荡选项的设定:有时候,由于数据点太密集,甚至产生了重叠,使得在观察数据中的 趋势受到影响,需要将这些数据点轻微的挪动位置,使得重合的数据点相互分开。使用 jitter(#)选项

3.3 二维绘图选项
3.2 主要讲解了散点图所特有的选项,这节讲所有二维绘图所共有的选项:标题选项、 坐标选项、图例选项、增加线选项,by 选项、scheme 选项、轴线选择选项、图形保存选项 以及图形输出选项。 1.坐标轴尺度选项组的设定 坐标轴尺度选项:yscale(axis_suboptions),设定 y 轴的外观 xscale(axis_suboptions),设定 x 轴的外观 tscale(axis_suboptions),设定 t 轴的外观 还有子选项的设定,即设定坐标轴尺度选项中可以填充的内容 2.坐标轴刻度选项组的设定:用于控制坐标轴的刻度和刻度的标识 3.坐标轴选项组的设定:用于设定坐标轴的标题 4.标题选项组的设定:用于设定绘图的标题以解释图像的内容 5.图例选项的设定:当图形中包含多个组别的相似内容时,Stata 将生成图例。图例表示图 形当中不同符号对应着的内容,它使得读者能够轻松读懂图中不同符号的含义。 6.by 选项的设定:一旦设定选项 by(),Stata 会根据括号中变量的不同取值重复作图,因此 by 的依据往往是分类变量,比如性别、民族、国内国外等。 语法:by(varlist[,byopts] 7.scheme 选项的设定:控制图形显示格式 8.轴线选择选项的设定 9.增加线选项的设定:用于在二维图形上添加增加线 10.scale 选项的设定:调整整个图像包括文本、标记和线段的大小 11.图形保存选项:Stata 将本身生成的图形存储分为两种形式:一种是内存的激活状态, 另一种是存入硬盘的状态 graph save my file ,replace,可将文件存储到硬盘中,保存成 myfile 文件,replace 表 示覆盖相同的名称的文件 12.图形的输出选项: (1)图形打印(2)存储为其他格式

第4章

其他图形绘制

4.1 绘制曲线标绘图和连线标绘图
1.绘制曲线标绘图:所谓曲线标绘画,就是其中点用线段连接起来的散点图,不过新的选项 可以控制曲线本身的特征 曲线标绘图的命令语法:[twoway] line varlist [if] [in] [,options] 2.绘制连线标绘图:连线标绘图是将每个散点连接起来,但不隐藏点。 命令:twoway connected varlist [if] [in] [weight] [,scatter_options]

4.2 绘制拟合图形
1.绘制一次拟合图形:实际分两步,首先使用 Stata 使用 yvar 为因变量,xvar 为自变量进 行一元线性回归,然后得到 yvar 的拟合值比如说是 hat,然后用 hat 对 xva 做曲线标绘图, 同是复合原始数据的散点图。 命令:twoway lfit yvar xvwr [if] [in] [weight] [,options] 如:sysuse auto Scatter mpg weight || lfit mpg weight 2.绘制二次拟合图形:命令 twoway qfit yvar xvar [if] [in] [weight] [,options] 如 sysuse auto scatter mpg weight || qfit mpg weight 4. 绘制 lowess 拟合图形:由于具有对拟合过程进行控制的选项,lowess 命令总的来说更 为专业也更为强大。 命令:twoway lowess yvar xvwr [if] [in] [weight] [,options] 如:sysuse auto twoway scatter mpg weight || lfit mpg weight||lowess mpg weight

4.3 绘制条形图
命令:graph bar yvars [if] [in] [weight] [,options](绘制纵向条形图) graph bar hyvars [if] [in] [weight] [,options] (绘制横向条形图) 1. 关于分类变量的讲解 2. 关于外形图外观的讲解

第 5 章 描述性统计分析
描述性统计的统计量大致可分为三类: 一是描述中心位置的度量; 二是描述波动情况的 度量;三是描述数据集中一个观测值相对位置的度量。另一个重要功能是分析异常值

5.1 描述性统计的原理
1. 定性变量:频率和频数 2. 定量变量: (1)集中趋势的度量:算术平均、中位数和众数 (2)变异程度的度量:极差(最大和最小观测值之差) 、方差、和标准差 (注意切比雪夫法则) (3)相对位置的度量:百分数和 z 得分(100p 百分位数是数据集的相对频率 分布中有 100p%的面积位于它的左边,有 100(1-p)%的面积位于它的右边,z= (4)偏度和峰度:偏度系数 SK=
n (x i ?x )4 ?3 x i ?x
2 2 (n ?1)

x i ?x s

(n ?1)(n ?2)(n ?3)S 4

5.2 描述性统计量的 Stata 实现
1.使用 summarize 命令计算和导出描述性统计量 语法:summarize [varlist] [if] [in] [weight] [,options] 2.使用 tabstat 命令计算描述性统计量 语法:tabstat varlist [if] [in] [weight] [,options]

Tabstat 与 summarize 的不一样之处在于其 by()选项允许对 by()中变量不同的取值分别做 描述性统计

5.3 探测异常值
1.计算 z 得分 命令:quietly summarize wage gen z=(wage-r(mean))/r(sd) list wage z if z>3 3. 箱线图(不太理解) 命令:graph box yvars [if] [in] [weight] [,options] graph hbox yvars [if] [in] [weight] [,options]

5.4 数据的正态性检验和数据转换
1. 2. 3. 4. 5. 正态性的检验包括:图形检验、卡方检验和其他统计检验 分位正态图的绘制的命令格式:qnorm varname [if] [in][,options] 偏度-峰度检验:sktest varlist [if] [in] [weight] [,noadjust] Shapiro-Wilk W 检验 swilk varlist [if] [in] [,options] Shapiro-Francia W’检验 sfrancia varlist [if] [in] D’Agostino 检验 sktestdc varlist[=esp] [if exp] [in range] [,noadjust]

5.5 相关系数
常用的相关系数共有如下 4 类:pearson 相关系数、Kendallτ相关系数、Spearman 秩相 关系数以及偏相关系数 1. pearson 相关系数:correlate[varlist] [if] [in] [weight] [, correlate_options] pwcorr[varlist] [if] [in] [weight] [, pwcorr_options] 2. spearman 和 Kendall 相关系数:ktau wage educ exper tenure,star(.05) 3. 偏相关系数:pcorr varnamel varlist [if] [in] [weight]

第6章

列联表分析

6.1 列联表分析
列联表是分析两个分类变量(名义变量或者定序变量)之间关系的基本统计方法 1. 独立性检验统计量:常用到皮尔逊卡方统计量和似然比统计量 2. 列联表中的相关测量统计量:度量两变量的关联强度,可以考察各种相关测量统计量, 对于名义变量而言,这些统计量有 Phi 系数、列联系数、Cramers’V 系数;对于定序变 量而言,可以使用γ统计量、Kendallτb 统计量、Stuartτc 统计量,它们的数值越大就表 明行变量和列变量之间的关联越强

6.2 Stata

的列联表分析—table 和 tabulate 命令

其中 table 命令可以很方便地生成列联表,而 tabulate 可以进行独立性检验

1.table 命令格式: table rowvar [colvar [supercolvar]] [if] [in] [weight] [,options] rowvar 代表行变量,colvar 代表列变量,supercolvar 代表更高阶的列变量,weight 表示权重 2.tabulate 命令进行列联表分析 (1)一维 tabulate 命令,主要用于生成含有频数的一维表格 tabulate varname [if] [in] [weight] [,tabulate1_options] (2)二维 tabulate 命令 二维 tabulate 命令在生成二维表格的同时,可以计算多种独立性检验统计量和相关测 量统计量 命令格式:tabulate varname1 varname2 [if] [in] [weight] [,options] 6.3 利用 Stata 生成包含描述性统计量的列表 1.tabstat 可以在一个表格中显示多个变量的多种描述性统计量 Tabstat varlist [if] [in] [weight] [,options] 3. tabulate ,summarize()用于生成一维或者二维的包含均值和标准差的表格,事实上, table 比 tabulate,summarize()更加灵活,而 tabulate,summarize()的特点在于运行 更快 tabulate,summarize()命令格式: tabulate varname1 [varname2] [if] [in] [weight] [,options]

第7章

方差分析

7.1 t 检验(样本小于 30)
1.t 检验的 Stata 基本命令 (1)单样本 t 检验的 Stata 操作 命令 1:ttest varname ==#[if] [in][,level(#)](通过样本进行 t 检验) 命令 2:ttesti #obs #mean #sd #val [,level(#)](通过样本的统计指标进行 t 检验) 其中,#obs 为样本容量,#mean 为样本均值,#sd 为标准差,#val 为待检验数值,level 为 置信度水平 2.两样本的 t 检验的 Stata 操作 命令格式 1 (通过样本进行双变量 t 检验) : ttest varname1==varname2 [if] [in],[option] 命令格式 2(通过样本进行分组 t 检验) : ttest varname [if] [in],by(groupvar) [options] 命令格式 3(通过样本的统计指标进行 t 检验) : ttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2 [,options]

7.2 单因素方差分析
1.单因素方差分析 Stata 实现 oneway 命令:oneway response_var factor_var [if] [in] [weight] [,options] longway 命令:longway response_var group_var [if] [in] [weight] [,options]

7.3 双因素和多因素方差分析
基本命令:anova response_var [if] [in] [weight] [,options]

7.4 协方差分析
命令:anova response_var [if] [in] [weight] [,options]

第 8 章 经典假设下的横截面数据单方程线 性回归模型的 Stata 实现
8.1 Stata 的回归分析
1.Stata 的回归分析---regress、predict、test 命令 regress、predict、test 是一组命令,它们完成各种简单和多元的普通最小二乘法回归。 regress 命令用于完成因变量对自变量的回归, 其后续命令 predict 可以计算预测值、 残差, 另一后续命令 test 检验用户指定的假设。 regress 命令的格式:regress depvar indepvars 【if】 【in】 【weight】 【options】 常用选项:noconstant(不加常数项做线性回归) hascons(由用户指定常数项的值) level(#)设定置信水平(默认值为 95%) beta(报告标准化的 beta 系数) noheader(不报告输出表名) 2.使用 predict 命令---计算拟合值和残差 predict 命令:predict [type] newvar [if] [in] [, single_options] predict 命令是 reg 命令的后续命令, 它可以用来保存最近一次回归的预测值、 残差值。 Type 用来指定你要用来存放拟合值或残差的格式,newvar 为用户为拟合值 或残差 2 取 的变量名,if、in 选项与第 2 章介绍的相同,[, single_options]用来指定你是要拟合 值还是残差值 [, single_options]可以是 resid 表示我们需要计算残差(默认报告是拟合值) 3.使用 test 命令---进行读者指定的检验 test 命令的格式:test var1 var2 ?var3k test var=C test var1=var2 test var1=(var2+var3)/C 在这里,要完成的任务是: (1) 检验单个变量的显著性 (2) 检验多个变量的联合显著性 (3) 检验不同变量系数的关系 如 test educ 0.5//来检验教育的系数是否为 0.5 Test educ exper //这一命令是检验教育、经验回报是否同时为零的联合显著性检验 4. sw regress 基本命令及其选项---逐步回归 sw regress 命令语法:sw regress depvar indepvars ,options options 常用选项:Lockterm(保证某些变量不被剔除) () (用于将括号内的变量看成 一个整体 hier(让 Stata 从最后一个变量开始剔除,而不是从最不显著的变量开始剔除)

第 9 章 非经典假设、线性方程组、面板 数据估计的 Stata 实现
9.1 非经典假设下的回归分析的 Stata 实现
1.多重共线性的检验和处理 (1)多重共线性的检验:用命令 vif//该命令用来得到自变量的方差膨胀因子。 一般而言,判断多重共线性的标准是: a. 最大的 vif 大于 10 b. 平均的 vif 大于 1 (2)多重多线性的处理 方法一:不加处理(往往是因为加二次项引起的,而这是有原因的) 方法二:减少自变量,将一些解释变量并入误差项 方法三:先采用在后面的将介绍的主成分分析和聚类分析,先将变量分类,然后再做回 归分析 2.内生性的检验和处理(外生性即:E(u|x)=0) 外生性的假设是所有假设中最重要的假设,违反它将合得估计值不一致。内生性检 验的命令是 ovtest, 它必须在 regress 命令之后。 结果上, 我们需要拒绝原假设 (p<0.05) , 即认为数据确实有内生性问题 Stata 中是用 ivreg 命令实现工具变量回归的,ivreg 命令的语法是 ivregress estimator depvar [varlist1] (varlist2=varlist_iv)\ 如:reg wage educ age kidslt6 kidsge6 exper expersq//没使用工具变量 reg wage age kidslt6 kidsge6 exper expersq(educ=motheduc)//使用工具变量 3、异方差的检验与处理 (1)异方差的检验:用 hettest//检验异方差,看 p 值,小于 0.05,不能排除异方差可能 (2)异方差的处理:只要在 reg 命令的 options 选项中选择 robust 选项即可。然后再用 test 命令做检验 如:reg wage educ age kidslt6 kidsge6 exper expersq ,robust

9.2 线性方程组的回归分析---Stata 实现
线性方程组包括两类:似不相关模型以及联立方程组模型 1. 似不相关模型的 Stata 实现 sureg (depvar1 varlist1) (depvar2 varlist2)?(depvarN varlistN)[if][in][weight] 2. 联立方程组模型的 Stata 实现 reg3 (depvar1 varlist1) (depvar2 varlist2)?(depvarN varlistN)[if][in][weight]

9.3 面板数据的 Stata 处理
Stata 并不会自动识别面板数据,必须告诉它哪个变量是时间维度,哪个变量是横截面 维度。在 Stata 中,要设置面板数据维度,可以使用 xtset 命令。其语法是: xtset panelvar timervar [,tsoptions] (panelvar 是用来表示横截面维度的变量,timevar 是用来表示时间维度的变量 ) 1. 固定效应的面板数据 Stata 实现 Xtreg 用来做固定效应的语法是:

Fixed-effects (FE) model Xtreg depvar [indepvars] [if][in][weight],fe [FE_options] (depvar 表示因变量,varslist 表示自变量,fe 表示 fixed effect 固定效应) Xtreg 常用选项(1)fe 使用固定效应回归 (2)robust 稳健回归 (3)level(#)设置置信水平,默认为 95% 2.随机效应的面板数据 Stata 实现 随机效应的方式处理面板数据的思想是将个人特质看做与自变量不相关,然后用传 统方法处理。也是使用 xtreg 命令,只不过选项由 fe 变为 re,其语法为: xtreg depvar [indepvars][if][in][,re RE_options](选项仅多一个 theta:报告θ)

第 10 章 非线性回归分析及回归诊断基础
10.1 非线性回归分析
第 7 章的有部分非线性模型可以转为线性模型, 这里介绍的是没有办法转化为线性回归 的回归模型。 1.非线性回归的 Stata 实现---nl 命令 nl 命令是用来实现单个自变量的非线性回归模型的 Stata 命令。语法: Interactive version nl (depvar=<sexp>) [if][in][weight][,options] depvar 表示因变量,sexp 用以表达非线性的形式 如:nl exp2 wage educ//非线性回归估计方法,用于估计β1 βx 2 形式的非线性模型参数

10.2 二值响应模型---使用 probit、logit;dprobit、logistic 命令
1. probit、dprobit 命令的使用方法 (1)probit 命令的格式和常用选项 语法: probit depvar [indepvars] [if][in][weight][,probit_options] (2)dprobit 命令的格式(与 probit 命令基本相同) probit 命令只能得到自变量参数的大小,而不能得到自变量真正作用的大小,要得到 变量真正的作用,需要使用 dprobit 命令。Dprobit 语法: probit regression ,reporting marginal effects dprobit [depvar indepvars [if][in][weight]][,probit_options] 2. logit、logistic 命令的使用方法 logit 命令的语法:logit depvar [indepvars] [if][in][weight][,probit_options] 与 probit 命令基本相同 Logistic 命令语法:logistic depvar indepvars [if][in][weight][,probit_options] 与 dprobit 一样,logistic 也是为了得到自变量的实际作用大小

10.3 多值响应模型—使用 mlogit、ologit 命令

多值响应就是 Y 有多个值,而不只是两个,分为两种:第一类的选择并没有好坏之分, 也就是所谓的无序响应模型; 另一种的选择本身就有好坏高低之分, 也就是所谓的有序响应 模型。 1. 无序响应模型---mlogit 命令 语法: mlogit depvar [indepvars] [if][in][weight][, options] 2. 有序响应模型---ologit 命令 语法: ologit depvar [indepvars] [if][in][weight][, options](选项与 logit 一致)

10.4 角点解模型—Tobit 命令的使用方法
角点解模型中因变量大致是连续的,但却在一点或多点上具有非零概率。 tobit 命令的语法: tobit depvar [indepvars] [if][in][weight],ll[(#)] ul[(#)][options]

10.5 样本选择模型—heckman 命令的使用方法
heckman 命令格式和常用命令,语法: heckman depvar [indepvars] ,select(varlist_s)[twostep] 或者 heckman depvar [indepvars] ,select(depvar_s=varlist_s)[twostep] select()表示输入选择方程

10.6 回归诊断
Graph twoway、rvfplot 基本命令---拟合程度的作图表现 graph twoway 命令的语法: graph twoway lfit/qfit depvar indepvar (lfit 表示一次项的拟合曲线,qfit 表示二次) rvfplot,yline(0) 该命令自动画出残差对拟合值的表绘图。


相关文章:
stata统计分析与应用笔记.doc
stata统计分析与应用笔记 - 第一章:Stata 概述:help 和 sea
Stata笔记 北京科技大学.doc
Stata笔记 北京科技大学_计算机软件及应用_IT/计算机...(elation) Totass Totlia 相关性分析,0.3 一下...描述性统计 pwcorr infee- right if y==2010 ...
stata 学习笔记(持续更新中) (2011-04-14 212642).doc
stata 学习笔记(持续更新中) (2011-04-14 212642)_计算机软件及应用_IT/...有时候分析必须有 nomata 不然无法分析 还可以有 small 小样本 t、F 统计量...
Stata上机实验笔记.pdf
Stata上机实验笔记。Stata上机实验 Stata 统计软件包...和程序语言的特点,几乎可以 完成全部复杂的统计分析...将所用系统自带的一些系统数据、应用程序、帮助文件...
第六章列联分析_图文.ppt
第六章列联分析_计算机硬件及网络_IT/计算机_专业资料。stata统计分析与应用 ...SAS笔记第六章,列联表分... 暂无评价 6页 5下载券 第6讲-列联分析与方差...
Stata上机实验笔记.doc
Stata上机实验笔记_计算机软件及应用_IT/计算机_专业资料。Stata 上机实验 Stata ...它同时具有数据管理软件、统计分析软件、 绘图软件、 Stata 上机实验 Stata 统计...
更多相关标签: