(i)求出样本中的平均工资和平均IQ。IQ的样本标准差是多少?(总体中的IQ已标准化为平均值是100,标准差是15。)
(ii)估计一个简单回归模型,其中IQ提高一个单位导致wage变化相同的数量。利用这个模型计算IQ提高15个单位时,工资的预期变化。10能够解释大多数工资波动吗?
(iii)现在再估计一个模型,其中IQ提高一个单位对工资具有相同的百分比影响。如果IQ提高15个单位,预期工资提高的百分比大约是多少?
A.参数平方和作为模型目标函数的一部分
B.参数绝对值之和作为模型目标函数的一部分
C.Lasso回归
D.在模型训练时,随机丢弃部分参数以达到正则化效果
E.岭回归
F.逻辑回归
(i)变量train是工作培训指标变量。样本中有多少人参与了工作培训项目?一个男人实际参加工作培训最多达几个月?
(ii)将train对unem74,unem75,age,educ,black,hisp和married等几个人口统计和培训前变量做一个线性回归。这些变量在5%的显著性水平上联合显著吗?
(iii)估计第(ii)部分中线性模型的一个概率单位形式。计算所有变量联合显著性的似然比检验。你得到什么结论?
(iv)基于第(ii)部分和第(iii)部分的答案,为解释1978年的失业状况,参与工作培训可视为外生变量吗?请解释。
(v)做unem78对train的简单回归,并以方程形式报告结果。估计参与工作培训项目对1978年失业的概率有何影响?它统计显著吗?
(vi)做unem78对train的概率单位模型。将train的概率单位系数与第(v)部分线性模型中得到的系数相比较有意义吗?
(vii)求出第(v)部分与第(vi)部分的拟合概率。解释它们为什么相同。为了度量工作培训项目的效果和统计显著性,你将采用哪个方法?
(viii)在第(v)部分与第(vi)部分模型中将第(ii)部分中的所有变量作为额外控制变量。现在拟合概率还相同吗?它们之间有何关系?
考虑简单回归模型
令z为x的二值工具变量。运用式(15.10),ⅣV估计量,可以写成:其中,是zi=0的那部分样本中yi和xi的样本平均值,而是zi=1的那部分样本中yi和xi的样本平均值。该估计量称为群组估计量, 它是由沃尔德(Wald, 1940) 最先提出。
(x)=x2或g(x)=log(1+x2) 。定义zi=g(xi)定义一个斜率估计量为
A.在严重多重共线性下,OLS估计量仍是最正确线性无偏估计量
B.多重共线性问题的实质是样本现象,因此可以通过增加样本信息得到改善
C.虽然多重共线性下,很难准确区分各个解释变量的单独影响,但可据此模型进展预测
D.如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性