401K.RAW中的数据是帕普克(Papke,1995)所分析数据的一个子集,帕普克是为了研究401(k)养老金计划的参与率和该计划的慷慨程度之间的关系。变量prate是有资格参与该计划的员工中拥有活动账户的百分比,也是我们要解释的变量。慷慨程度指标是计划的匹配率mrate。这个变量给出了员工每向这个账户存1美元,公司为该员工匹配的平均数量。例如,若mrate=0.50,则员工每投入1美元,公司就匹配50美分。
(i)求出该计划的样本中平均参与率和平均匹配率。
(ii)现在估计下面这个简单回归方程prate=β0+β1mrate报告你的结果以及样本容量和R。
(iii)解释你的方程中的截距。解释mrate的系数。
(iv)当mrate=3.5时,求出prate的预测值。这是一个合理的预测吗?解释这里出现的情况。
(v)prate的波动中,有多少是由mrate解释的?你认为,这是一个足够大的量吗?
第2题
(i)计算样本中netta的平均值、标准差、最小值和最大值。
(ii)检验假设:平均netta不会因为401(k)资格状况而有所不同,使用双侧备择假设。估计差异的美元数量是多少?
(iii)根据第7章的计算机练习C7的第(ii)部分,e401k在一个简单回归模型中显然不是外生的,起码它随着收入和年龄而变化。以收入、年龄和e401k作为解释变量估计nettfa的一个多元线性回归模型。收入和年龄应该以二次函数形式出现。现在,估计401(k)资格的美元效应是多少?
(iv)在第(ii)部分估计的模型中,增加交互项e401k(age-41)和e401k-(age-41)2。注意样本中的平均年龄约为41岁,所以在新模型中,e401k的系数是401(k)资格在平均年龄处的估计效应。哪个交互项显著?
(v)比较第(iii)和(iv)部分的估计值,401(k)资格在41岁处的估计效应差别大吗?请解释。
(vi)现在,从模型中去掉交互项,但定义5个家庭规模虚拟变量:fsizel,fsize2,fsize3,fsize4和fsize5。对有5个或5个以上成员的家庭,fsize5等于1。在第(ii)部分估计的模型中,增加家庭规模虚拟变量,记得选择一个基组。这些家庭虚拟变量在1%的显著性水平上显著吗?
(vii)现在,针对模型
在容许截距不同的情况下,做5个家庭规模类别的邹至庄检验。约束残差平方和SSR,从第(iv)部分得到,因为那里回归假定了相同斜率。无约束残差平方和其中SSRf是从仅用家庭规模f估计的方程中得到的残差平方和。你应该明白,无约束模型中有30个参数(5个截距和25个斜率),而约束模型中有10个参数(5个截距和5个斜率)。因此,带检验的约束个数是q=20,而且无约束模型的df为9275-30=9245。
第3题
(i)利用OLS估计这个方程,按照通常形式报告结果,并解释e401k的系数。
(ii)利用布罗施-帕甘检验,使用OLS残差检验异方差性。u看上去独立于解释变量吗?
(iii)用LAD估计这个方程,并以对OLS同样的方式报告结果。解释e401k的系数。
(iv)调和第(i)部分和第(iii)部分的结论。
第4题
(i)将log(uclms)对一个时间趋势变量和11个月度虚拟变量进行回归。这段时期中失业救济金登记人数的总体趋势如何?(解释时间趋势的系数。)失业救济金登记中有季节性的证据吗?
(ii)第(i)部分的回归中增加一个虚拟变量EX,并令其在安德森市成立工业区的月份取值为1.建立工业区看起来是否降低了失业救济金登记人数?降低了多少?
(iii)若要把第(ii)部分得到的影响全部归功于EZ的建立,需要做哪些假定?
第6题
(i)数据集中有多少无子女已婚夫妇?
(ii)利用OLS估计模型
nettfa=β0+β1inc+β2age+u;
并以常用格式报告结果。解释斜率系数。斜率估计值有何惊人之处吗?
(iii)第(ii)部分的回归截距有重要意义吗?请解释。
(iv)在1%的显著性水平上,针对H0:β2>1检验H0: β2=1,求出p值。你能拒绝H0吗?
(V)如果你做一个nettfa对inc的简单回归,inc的斜率估计值与第(ii)部分的估计值有很大不同吗?为什么?
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!