利用数据集GPA1.RAW。
(i)利用OLS估计一个将colGPA与hsGPA,ACT,skipped和PC相联系的模型。求OLS残差。
(ii)计算异方差性的怀特检验特殊情形。在对colGPA,和colGPA,的回归中,求拟合值。
(iii)验证第(ii)部分得到的拟合值都严格为正。然后利用权数1/h求加权最小二乘估计值。根据对应的OLS估计值,将逃课和拥有计算机之影响的加权最小二乘估计值与对应OLS估计值相比较。它们的统计显著性如何?
(iv)在第(iii)部分的WLS估计中,求异方差-稳健的标准误。换言之,容许第(ii)部分中所估计的方差函数可能误设(参见问题8.4)。标准误与第(iii)部分相比有很大变化吗?
第1题
colgpa=1.392-0.0135hsperc+0.00148sat
n=4137,R2=0.273
其中,colgpa以四分制度量,hsperc是在高中班上名次的百分位数(比方说,hsperc=5,就意味着位于班上前5%之列),而sat是在学生能力测验中数学和语言的综合成绩。
(i)为什么hsperc的系数为负也讲得通?
(ii)当hsperc=20和sat=1050时,大学GPA的预测值是多少?
(iii)假设两个在高中班上具有同样百分位数的高中毕业生A和B,但A学生的SAT分数要高出140分(在样本中相当于一倍的标准差),那么,预计这两个学生的大学GPA相差多少?这个差距大吗?
(iv)保持hsperc不变,SAT的分数相差多少,才能导致预测的colgpa相差0.50或四分制的半分?评论你的结论。
第2题
(i)考虑方程
其中,colgpa表示累积的大学GPA,hsize表示高中毕业年级以百人计的规模,hsperc表示在毕业年级中学术排名的百分位,sat表示SAT综合分数,female是一个二值变量,而athlete也是一个运动员取值1的二值变量。你对这个方程中的系数有何预期?哪些你没有把握?
(ii)估计第(i)部分中的方程,并以通常的形式报告结果。估计运动员和非运动员之间GPA的差异是多少?它是统计显著的吗?
(ii)从模型中去掉sat并重新估计这个方程。现在,作为运动员的估计影响是多大?讨论为什么这个估计值不同于第(ii)部分的结论。
(iv)在第(i)部分的模型中,容许作为运动员的影响会因性别不同而不同。检验如下原假设:在其他条件不变的情况下,女生是否是运动员没有差别。
(v)sat对colgpa的影响会因性别不同而不同吗?讲出你的根据。
第3题
(i)在估计方程(7.6)中增加变量mothcoll和fathcoll,并以通常的形式报告结果。拥有PC的估计影响会怎么样?PC还是统计显著的吗?
(ii)检验第(i)部分方程中mothcoll和fathcoll的联合显著性,不要忘记报告p值。
(iii)在第(i)部分的模型中增添hsGPA,并判断是否有必要进行这种扩展。
第4题
(i)求出变量atndrte,pricGPA和ACT的最小值、最大值和平均值。
(ii)估计模型atndrte=β0+β1pricGPA+β2ACT+u,并以方程的形式写出结论。对截距做出解释。它是否有一个有用的含义。
(iii)讨论估计的斜率系数。有没有什么令人吃惊之处?
(iv)如果priGPA=3.65和ACT=20,预计atndrte是多少?你对这个结论做何解释?样本中有没有一些学生具有这些解释变量的值?
(v)如果学生A具有priGPA=3.1和ACT=21,而学生B具有priGPA=2.1和ACT=26,他们在出勤率上的预期差异是多少?
第5题
(i)估计模型
其中,hsize为毕业年级的规模(以百为单位),按通常的格式写出结论。二次项是统计显著的吗?
(ii)利用第(i)部分的估计方程,高中学校的“最优”规模是什么?说明你的答案。
(iii)这个分析是所有高中高年级学生学术成绩的代表吗?请解释。
(iv)用log(sat)作为因变量,求出估计的高中最优规模。它与你在第(ii)部分得到的结论很不同吗?
第6题
(i)利用OLS估计GPA和ACT的关系;也就是说,求出如下方程中的截距和斜率估计值
GPA=β0+β1ACT
评价这个关系的方向。这里的截距有没有一个有用的解释?请说明。如果ACT分数提高5分,预期GPA会提高多少?
(ii)计算每次观测的拟合值和残差,并验证残差和(近似)为零。
(iii)当ACT=20时,GPA的预测值为多少?
(iv)对这8个学生来说,GPA的波动中,有多少能由ACT解释?试说明。
第7题
(i)在例6.3的模型中,推出
当priGPA=2.59和atndrte=82时,利用方程(6.19)来估计偏效应。对你的估计进行解释。
(ii)证明可将方程写成
其中(注意,截距已发生变化,但并不重要。)用它求出第(i)部分得到的θ2的标准差。
第8题
变量sat是SAT的综合分数,hsize是以百人计的学生所在高中毕业年级的学生规模,female是一个性别虚拟变量,而black是一个种族虚拟变量(黑人取值1,其他人则取值0)。
(i)有很强的证据支持模型中应该包括hsize”吗?从这个方程来看,最优的高中规模是什么?
(ii)保持hsize不变,非黑人女性和非黑人男性之间SAT分数的估计差异是多少?这个估计差异的统计显著性如何?
(iii)非黑人男性和黑人男性之间SAT分数的估计差异是多少?检验其分数没有差异的原假设,备择假设是他们的分数存在差异。
(iv)黑人女性和非黑人女性之间SAT分数的估计差异是多少?为了检验这个差异的统计显著性,你需要怎么做?
第9题
(i)使用与第3章习题4一样的模型,表述并检验原假设:在其他条件不变的情况下,法学院排名对起薪中位数没有影响。
(ii)新生年级的学生特征(即LSAT和GPA)对解释salary而言是个别或联合显著的吗?
(iii)检验是否要在方程中引入入学年级的规模(clsize)和教职工的规模(faculty);只进行一个检验。(注意解释clie和facuiy的缺失数据。)
(iv)还有哪些因素可能影响到法学院排名,但又没有包括在薪水回归中?
第10题
(i)解释calculus的系数,考虑它的估计效应是不是合理。
(ii)控制了msugpa后,高中表现(绩点或者ACT成绩)是不是还对预测微观经济学原理的成绩有帮助?
(iii)当把mothcoll和fathcoll从方程中去掉之后,R变为0.4188。是否有证据表明在控制了其他解释变量之后,有一个拥有大学学历的父母对微观经济学原理的成绩有帮助?
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!