A.决定系数测度回归模型对样本数据的拟合程度
B.决定系数等于1,说明回归模型可以解释因变量的所有变化
C.决定系数取值越大,回归模型的拟合效果越差
D.决定系数取值在[0,1]之间
E.如果决定系数等于1,所有观测点都会落在回归直线上
(i)变量train是工作培训指标变量。样本中有多少人参与了工作培训项目?一个男人实际参加工作培训最多达几个月?
(ii)将train对unem74,unem75,age,educ,black,hisp和married等几个人口统计和培训前变量做一个线性回归。这些变量在5%的显著性水平上联合显著吗?
(iii)估计第(ii)部分中线性模型的一个概率单位形式。计算所有变量联合显著性的似然比检验。你得到什么结论?
(iv)基于第(ii)部分和第(iii)部分的答案,为解释1978年的失业状况,参与工作培训可视为外生变量吗?请解释。
(v)做unem78对train的简单回归,并以方程形式报告结果。估计参与工作培训项目对1978年失业的概率有何影响?它统计显著吗?
(vi)做unem78对train的概率单位模型。将train的概率单位系数与第(v)部分线性模型中得到的系数相比较有意义吗?
(vii)求出第(v)部分与第(vi)部分的拟合概率。解释它们为什么相同。为了度量工作培训项目的效果和统计显著性,你将采用哪个方法?
(viii)在第(v)部分与第(vi)部分模型中将第(ii)部分中的所有变量作为额外控制变量。现在拟合概率还相同吗?它们之间有何关系?
(i)利用表13-1中同样的变量估计kids的一个泊松回归模型。解释y82的系数。
(ii)保持其他因素不变,黑人妇女和非黑人妇女在生育上的估计百分数差异是多少?
(iii)求σ。有过度散布和散布不足的证据吗?
(iv)计算泊松回归中的拟合值和作为kidsi和kidsi之相关系数平方的R2。并与线性回归模型中的R2相比较。
(i)求出样本中的平均工资和平均IQ。IQ的样本标准差是多少?(总体中的IQ已标准化为平均值是100,标准差是15。)
(ii)估计一个简单回归模型,其中IQ提高一个单位导致wage变化相同的数量。利用这个模型计算IQ提高15个单位时,工资的预期变化。10能够解释大多数工资波动吗?
(iii)现在再估计一个模型,其中IQ提高一个单位对工资具有相同的百分比影响。如果IQ提高15个单位,预期工资提高的百分比大约是多少?
根据下表所给的资料,拟合一个回归模型,并回答下述问题。
(1)求出a、b,说明b的含意是什么?
(2)由题(1)所得的回归方程,标准估计误差是多少?
(3)对回归直线的斜率作显著性检验,P值是多少?
(4)一个13岁的男孩的血压估计值是多少?
血压与年龄的关系
年龄X 血压(mmHg)Y | 年龄X 血压(mmHg)Y |
5 94.4 6 97.7 7 101.9 8 104.5 9 106.3 | 12 113.8 13 117.7 14 121.6 15 122.3 16 123.6 |
)与每个学生的平均支出(expend) 之间的关系。
(Ⅰ)就多花一美元对通过率的影响而言,你认为具有恒定不变的影响合适呢,还是这种影响越来越小更合适?请加以解释。
(Ⅱ) 在总体模型math10=β0+β1log(expend)+u中,证明民β1/10表示expend提高10%导致math10改变的百分数。
(II) 利用MEAP 93.RAW中的数据, 估计(Ⅱ) 中的模型.按照通常的方式报告估计方程, 包括样本容量和及R2。
(Ⅳ)支出的估计影响有多大?也就是说, 如果支出提高10%, 估计math10会提高多少个百分点?
(Ⅴ)有人担心这个回归分析可能得到math10的拟合值会超过100。为什么在这个数据集中不必担心这个问题?
序号 IQ(x) DI(y) | 序号 IQ(x) DI(y) |
1 110 20.2 2 89 33 3 102 17.5 4 98 25.25 5 110 20.3 6 98 31.9 7 122 21.1 8 119 22.7 9 120 10.7 | 10 92 22.1 11 116 18.6 12 85 35.5 13 73 38 14 90 30 15 104 19.7 16 82 41.1 17 134 39.6 18 114 25.15 |
A.向前选择法是从模型中没有自变量开始,然后将所有自变量依次增加到模型中
B.向后剔除法是先对所有自变量拟合线性回归模型,然后依次将所有自变量剔除模型
C.逐步回归法是将向前选择法和向后剔除法结合起来,但不能保证得到的回归模型一定就显著
D.逐步回归法选择变量时,在前面步骤中增加的自变量在后面的步骤中有可能被剔除,而在前面步骤中剔除的自变量在后面的步骤中也可能重新进入到模型中
考虑简单回归模型
令z为x的二值工具变量。运用式(15.10),ⅣV估计量,可以写成:其中,是zi=0的那部分样本中yi和xi的样本平均值,而是zi=1的那部分样本中yi和xi的样本平均值。该估计量称为群组估计量, 它是由沃尔德(Wald, 1940) 最先提出。