在例7.12中,我们估计了一个线性概率模型以说明一个年轻人在1986年是否被拘捕:(i)用OLS估计此模
在例7.12中,我们估计了一个线性概率模型以说明一个年轻人在1986年是否被拘捕:
(i)用OLS估计此模型, 并验证其全部估计值都严格地介于0和1之间。最大和最小的估计值各是多少?
(ii)像8.5节所讨论的那样,用加权最小二乘法估计这个方程。
(iii)用WLS估计值决定avgsen和tottie在5%的显著性水平上是否联合显著。
在例7.12中,我们估计了一个线性概率模型以说明一个年轻人在1986年是否被拘捕:
(i)用OLS估计此模型, 并验证其全部估计值都严格地介于0和1之间。最大和最小的估计值各是多少?
(ii)像8.5节所讨论的那样,用加权最小二乘法估计这个方程。
(iii)用WLS估计值决定avgsen和tottie在5%的显著性水平上是否联合显著。
(i)用虚拟变量demwins来代替教材(10.23)中的demvote,并用通常的格式报告结果。哪些因素影响获胜概率?请用截至1992年的数据。
(ii)有多少个拟合值小于0?有多少个拟合值大于1?
(iii)采用下面的预测规则:如果demwins>0.5,你就可以预测民主党会获胜;否则,共和党将获胜。那么,在这20次选举中,这个模型有多少次正确地预测了实际结果?
(iv)代入1996年的解释变量值。预测克林顿赢得这次选举的可能性有多大。事实上,克林顿获胜了,你的预测结果是否与事实相符?
(v)对误差中的AR(1)序列相关,做异方差-稳健:检验。你有何发现?
(vi)求出第(i)部分中估计值的异方差-稳健标准误。!统计量有什么明显的变化吗?
利用401KSUBS.RAW中的数据。我们感兴趣的方程是一个线性概率模型
这里的目标是要检验参与一项401(k)计划与拥有一个个人退休金账户(IRA)是否有替换关系。因此,我们想估计β1。
(i)用OLS估计方程,并讨论p401k的估计影响。
(ii)为了估计这两种不同类型的退休储蓄计划在其他条件不变情况下的替换关系,使用普通最小二乘法可能存在什么问题?
(iii)变量e401k是一个二值变量,并在一个工人有资格参与一项401(k)计划时取值1。解释欲使e401k成为p401k的一个有效Ⅳ所需要的条件。这些假定看起来合理吗?
(iv)估计p401k的约简型方程,并验证e401k与p401k具有显著的偏相关。因为约简型也是一个线性概率模型,所以使用一个异方差-稳健的标准误。
(v)现在,用Ⅳ估计结构方程,并将β1的估计值与OLS估计值相比较。你同样应该到异方差-稳健的标准误。
(vi)利用一个异方差-稳健的检验,检验如下虚拟假设:p401k实际上是外生的。
利用数据集401KSUBS.RAW。
(i)利用OLS估计e401k的一个线性概率模型,解释变量为inc,inc²,age,age²和male。求通常的OLS标准误和异方差-稳健的标准误。它们有重要差别吗?
(iii)对第(i)部分估计的模型求怀特检验,并分析系数估计值是否大致对应于第(ii)部分中描述的理论值。
(iv)在验证了第(i)部分的拟合值都介于0和1之间后,求这个线性概率模型的加权最小二乘估计值。它们与OLS估计值有重大差别吗?
本题使用PHILLIPS.RAW中的数据。
(i)例11.5中,我们估计了如下形式的附加预期的菲利普斯曲线:
解释为什么这使得unemt-1成为unemt的一个好的Ⅳ候选者。
(iii)将unemt对unemt-1做回归。unemt与memt-1是否显著相关?
(iv)用IV估计附加预期的菲利普斯曲线。以通常形式报告结果,并将之与例11.5中的OLS估计值进行比较。
利用BWGHT.RAW中的数据,可估计出如下方程:
变量定义和教材例4.9中一样,但我们增加了两个虚拟变量:一个虚拟变量表明孩子是不是男孩,另一个虚拟变量则表明这个孩子是不是白人。
(i)在第一个方程中,解释变量cigs的系数。具体而言,每天多抽10根烟对婴儿出生体重有何影响?
(ii)在第一个方程中,保持其他因素不变,预计一个白人孩子的出生体重比一个非白人孩子重多少?这个差异是统计显著的吗?
(iii)评价motheduc的估计影响和统计显著性。
(iv)从这些给定信息中,为什么不能计算出检验motheduc和fatheduc联合显著性的F统计量?为了计算这个统计量,还需要做些什么?
(i) 估计一个将respond与resplast和avggift联系起来的线性概率模型。以通常的形式报告结果, 并解释变量resplast的系数。
(ii)过去捐助的平均水平看来会影响做出捐助响应的概率吗?
(iii) 在模型中增加变量propres p并解释其系数。(这里须注意, propresp增加1是最大可能变化。)
(iv) 在回归中增加propres p以后, resp last的系数有何变化?这讲得过去吗?
(v) 在模型中增加每年寄出邮件的数量mail year。它的估计影响有多大?为什么它不是邮件数量对响应的因果关系的一个较好的估计?
A.如果使用横断面数据进行回归分析会使r2的值上升。
B.回归分析对估计利息收入不再适用。
C.一些没有包括在模型中的新的因素引起了收入的变化。
D.线性回归分析会提高模型的可信度。
(i)将每个δj的公式代入分布滞后模型,并把它写成用γh表示的模型,h=0,1,2。
(ii)解释你用来估计γh的回归方程。
(iii)上面的多项式分布滞后模型是一般模型的一个约束形式。它受到了多少个约束?你如何来检验它们?(提示:用F检验。)
A.分析现存的医疗业务和健康结果的数据。
B.提出了一套相关的因果见解。
C.把几个普遍的原则应用于一个具体的情况。
D.提出一个总的意见,然后用几个具体的例子来证实它。
利用TRAFFIC2.RAW中的数据。
(i)计算变量prefat的一阶自相关系数。你认为prefat包含单位根吗?失业率也一样吗?
(i)估计一个将prcfat的一阶差分Aprcfat与第10章的计算机练习C11第(vi)部分中同样变量相联系的多元回归模型,只是你还应该对失业率进行一阶差分。于是,模型中包含一个线性时间趋势、月度虚拟变量、周末变量和两个政策变量;不要将这些变量进行差分。你发现了什么有意思的结论吗?
(iii)评论如下命题:“在进行多元回归之前,我们总应该将怀疑具有单位根的时间序列进行一阶差分,因为这样做是一种安全策略,而且应该得到与使用水平值类似的结论。”[在回答这个问题时,最好先做(如果你还没有做过的话)第10章的计算机练习C11第(vi)部分中的回归。]