(i) 估计一个将respond与resplast和avggift联系起来的线性概率模型。以通常的形式报告结果, 并解释变量resplast的系数。
(ii)过去捐助的平均水平看来会影响做出捐助响应的概率吗?
(iii) 在模型中增加变量propres p并解释其系数。(这里须注意, propresp增加1是最大可能变化。)
(iv) 在回归中增加propres p以后, resp last的系数有何变化?这讲得过去吗?
(v) 在模型中增加每年寄出邮件的数量mail year。它的估计影响有多大?为什么它不是邮件数量对响应的因果关系的一个较好的估计?
利用BWGHT.RAW中的数据,可估计出如下方程:
变量定义和教材例4.9中一样,但我们增加了两个虚拟变量:一个虚拟变量表明孩子是不是男孩,另一个虚拟变量则表明这个孩子是不是白人。
(i)在第一个方程中,解释变量cigs的系数。具体而言,每天多抽10根烟对婴儿出生体重有何影响?
(ii)在第一个方程中,保持其他因素不变,预计一个白人孩子的出生体重比一个非白人孩子重多少?这个差异是统计显著的吗?
(iii)评价motheduc的估计影响和统计显著性。
(iv)从这些给定信息中,为什么不能计算出检验motheduc和fatheduc联合显著性的F统计量?为了计算这个统计量,还需要做些什么?
数据集401KSUBS.RAW包含了净金融财富(nenfa)、被调查者年龄(age)、家庭年收入(inc)、家庭规模(fsize)方面的信息,以及参与美国个人的特定养老金计划方面的信息。财富和收入变量都以千美元为单位记录。对于这里的问题,只使用无子女已婚者数据(marr=1,fsize=2)。
(i)数据集中有多少无子女已婚夫妇?
(ii)利用OLS估计模型
nettfa=β0+β1inc+β2age+u;
并以常用格式报告结果。解释斜率系数。斜率估计值有何惊人之处吗?
(iii)第(ii)部分的回归截距有重要意义吗?请解释。
(iv)在1%的显著性水平上,针对H0:β2>1检验H0: β2=1,求出p值。你能拒绝H0吗?
(V)如果你做一个nettfa对inc的简单回归,inc的斜率估计值与第(ii)部分的估计值有很大不同吗?为什么?
为了确定避孕套的使用在降低有性行为的高中生之间传播性疾病的有效性,一个简单的模型为
其中, inf rate表示有性行为的学生中感染性病的比例, con use表示声称合理地使用了避孕套的男孩子比例,avg inc表示平均家庭收入, 而city则是一个表示所在学校是否处在城里的虚拟变量; 这个模型是在学校这个层次上做的。
(i)在因果性和其他条件不变的模式下解释上述方程,β1的符号应该是什么?
(ii)为什么inf rate和com se可能是联合决定的?
(iii)如果避孕套使用率随着性病感染率的上升而提高,所以在下式中
(iv)令aris表示一个二值变量,若学校有分发避孕套项目则取值1.解释这如何用于通过Ⅳ估计β1(和其他系数)。我们必须在每个方程中对concis做怎样的假定?
本题要用到HTV.RAW中的数据。
(i)考虑一个加入了父母受教育程度变量的工资方程
表述原假设:父亲与母亲的受教育程度对log(wage)具有相同影响。
(ii)估计第(i)部分中的模型,同时谈谈你对β,和队大小的看法。
(iii)在5%的显著性水平上,相对于双侧备择假设,通过构造一个95%的置信区间来检验第(i)部分中的原假设。你得到的结论是什么?
利用KIELMC.RAM中的数据。
(i)变量dist是从每个房屋到焚烧炉位置的英尺距离。考虑模型
如果建造焚烧炉会减少其附近的房屋价值,那么δ1的符号将是什么?若β1>0,则意味着什么?
(ii)估计第(i)部分中的模型并按通常的方式报告结果。解释y81-log(dist)的系数。你得到了什么结论?
(iii)在方程中增加age,age2,rooms,baths,log(intst),log(land)和log(area)。现在,你对焚烧炉对房屋价值的影响会作出什么结论?
利用数据集401KSUBS.RAW。
(i)利用OLS估计e401k的一个线性概率模型,解释变量为inc,inc²,age,age²和male。求通常的OLS标准误和异方差-稳健的标准误。它们有重要差别吗?
(iii)对第(i)部分估计的模型求怀特检验,并分析系数估计值是否大致对应于第(ii)部分中描述的理论值。
(iv)在验证了第(i)部分的拟合值都介于0和1之间后,求这个线性概率模型的加权最小二乘估计值。它们与OLS估计值有重大差别吗?
(i)考虑静态非观测效应模型
其中,enrolit表示学区总注册学生人数,lunchit表示学区中学生有资格享受学校午餐计划的百分数。(因此lunchit是学区贫穷率的一个相当好的度量指标。)证明:若平均每个学生的真实支出提高10%,则math4it约改变β1/10个百分点。
(ii)利用一阶差分估计第(i)部分中的模型。最简单的方法就是在一阶差分方程中包含一个截距项和1994~1998年度虚拟变量。解释支出变量的系数。
(iii)现在,在模型中添加支出变量的一阶滞后,并用一阶差分重新估计。注意你又失去了一年的数据,所以你只能用始于1994年的变化。讨论即期和滞后支出变量的系数和显著性。
(iv)求第(iii)部分中一阶差分回归的异方差-稳健标准误。支出变量的这些标准误与第(iii)部分相比如何?
(v)现在,求对异方差性和序列相关都保持稳健的标准误。这对滞后支出变量的显著性有何影响?
(vi)通过进行一个AR(1)序列相关检验,验证差分误差rit=Δuit含有负序列相关。
(vii)基于充分稳健的联合检验,模型中有必要包含学生注册人数和午餐项目变量吗?
其中,因为滞后支出变量,第一个可用年份(基年)是1993年。
(i)用混合OLS估计模型,并报告通常的标准误。为使得ai的期望值可以非零,你应该与年度虚拟变量一起包含一个截距项。支出变量的估计效应是什么?求OLS残差。
(ii)lunchit系数的符号在意料之中吗?解释系数的大小。你认为学区的贫穷率对考试通过率有很大的影响吗?
(iii)利用的回归计算AR(1)序列相关的一个检验。你应该在回归中使用1994-1998年的数据。验证存在很强的正序列相关,并讨论为什么。
(iv)现在用固定效应法估计方程。滞后的支出变量仍显著吗?
(v)你为什么认为在固定效应估计中,注册学生人数和午餐项目变量不是联合显著的?
(vi)定义支出的总(或长期)效应为的标准误。