在线性回归模型中,若解释变量X1和X2的观测值成比例,即有X1=kX2,其中k为非零常数,则该模型中存在()。
A.方差非齐性
B.多重共线性
C.序列有关
D.设定误差
A.方差非齐性
B.多重共线性
C.序列有关
D.设定误差
:年龄x1,体重x2(单位:kg),1500m跑用的时间x3(单位:min),静止时心率x4(单位:次/mim),跑步后心率x5(单位:次/min)。对24名38至57岁的志愿者进行了测试,结果如下表。试建立耗氧能力y与诸因素之间的回归模型。
(1)若x1~x5中只许选择1个变量,最好的模型是什么?
(2)若x1~x5中只许选择2个变量,最好的模型是什么?
(3)若不限制变量个数,最好的模型是什么?你选择哪个作为最终模型,为什么?
(4)对最终模型观察残差,有无异常点?若有,剔除后如何?
(i)利用表13-1中同样的变量估计kids的一个泊松回归模型。解释y82的系数。
(ii)保持其他因素不变,黑人妇女和非黑人妇女在生育上的估计百分数差异是多少?
(iii)求σ。有过度散布和散布不足的证据吗?
(iv)计算泊松回归中的拟合值和作为kidsi和kidsi之相关系数平方的R2。并与线性回归模型中的R2相比较。
已知线性同归方程
=a+bx的a=7,b=2,若样本容量n=5,两变量的协差平方和lxy=12,∑x12=51,则样本均数
________,
________。
建立Y关于X1和X2的回归方程;
A.在严重多重共线性下,OLS估计量仍是最正确线性无偏估计量
B.多重共线性问题的实质是样本现象,因此可以通过增加样本信息得到改善
C.虽然多重共线性下,很难准确区分各个解释变量的单独影响,但可据此模型进展预测
D.如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性
(i)变量train是工作培训指标变量。样本中有多少人参与了工作培训项目?一个男人实际参加工作培训最多达几个月?
(ii)将train对unem74,unem75,age,educ,black,hisp和married等几个人口统计和培训前变量做一个线性回归。这些变量在5%的显著性水平上联合显著吗?
(iii)估计第(ii)部分中线性模型的一个概率单位形式。计算所有变量联合显著性的似然比检验。你得到什么结论?
(iv)基于第(ii)部分和第(iii)部分的答案,为解释1978年的失业状况,参与工作培训可视为外生变量吗?请解释。
(v)做unem78对train的简单回归,并以方程形式报告结果。估计参与工作培训项目对1978年失业的概率有何影响?它统计显著吗?
(vi)做unem78对train的概率单位模型。将train的概率单位系数与第(v)部分线性模型中得到的系数相比较有意义吗?
(vii)求出第(v)部分与第(vi)部分的拟合概率。解释它们为什么相同。为了度量工作培训项目的效果和统计显著性,你将采用哪个方法?
(viii)在第(v)部分与第(vi)部分模型中将第(ii)部分中的所有变量作为额外控制变量。现在拟合概率还相同吗?它们之间有何关系?
A.3个自变量应该至少有1个以上的回归系数的检验结果是显著的,不可能出现3个自变量回归系数检验的P-Value都大于0.05的情况
B.有可能出现3个自变量回归系数检验的P-Value都大于0.05的情况,这说明数据本身有较多异常值,此时的结果已无意义,要对数据重新审核再来进行回归分析
C.有可能出现3个自变量回归系数检验的P-Value都大于0.05的情况,这说明这3个自变量间可能有相关关系,这种情况很正常
D.ANOVA表中的P-Value=0.0021说明整个回归模型效果不显著,回归根本无意义
A.为了便于确定模型的解释变量
B.为了使估计的参数具有良好的统计性质
C.为了便于确定所估计参数的均值
D.为了便于得出模型参数的估计值
A.向前选择法是从模型中没有自变量开始,然后将所有自变量依次增加到模型中
B.向后剔除法是先对所有自变量拟合线性回归模型,然后依次将所有自变量剔除模型
C.逐步回归法是将向前选择法和向后剔除法结合起来,但不能保证得到的回归模型一定就显著
D.逐步回归法选择变量时,在前面步骤中增加的自变量在后面的步骤中有可能被剔除,而在前面步骤中剔除的自变量在后面的步骤中也可能重新进入到模型中
A.X2的影响远远大于X1的影响
B.X2的影响显著,X1的不确定
C.X1的系数很小,因此X1不显著
D.仅根据此方程无法判断X的影响大小及显著性