在用离散样本点数据去研究一个区域的数据分布时,对比面插值法,泰森多边形法的缺陷为()
A.计算速度慢
B.数据处理步骤复杂
C.对于样本点数据精度要求高
D.生成的数据分布结果粗糙
A.计算速度慢
B.数据处理步骤复杂
C.对于样本点数据精度要求高
D.生成的数据分布结果粗糙
A、分类数据
B、顺序数据
C、数值型数据
D、离散型数据
序号 IQ(x) DI(y) | 序号 IQ(x) DI(y) |
1 110 20.2 2 89 33 3 102 17.5 4 98 25.25 5 110 20.3 6 98 31.9 7 122 21.1 8 119 22.7 9 120 10.7 | 10 92 22.1 11 116 18.6 12 85 35.5 13 73 38 14 90 30 15 104 19.7 16 82 41.1 17 134 39.6 18 114 25.15 |
参考4.4节中所用的例子。你将使用数据集TWOYEAR.RAW.
(i)变量phsrank表示一个人的高中百分位等级。(数字越大越好。比如90意味着, 你的排名比所在班级中90%的同学更高。)求出样本中phsrank的最小、最大和平均值。
(ii)在方程(4.26) 中增加变量phsrank, 并照常报告OLS估计值。phs rank在统计上显著吗?高中排名提高10个百分位点,能导致工资增加多少?
(iii)在方程(4.26) 中增加变量phs rank显著改变了2年制和4年制大学教育回报的结论了吗?请解释。
(iv)数据集包含了一个被称为id的变量。你若在方程(4.17)或(4.26)中增加id,预计它在统计上不会显著,解释为什么?双侧检验的p值是多少?
A、从互联网产生大数据的角度来看,大数据具有“4V”特征,分别是大量(Volume),多样(Variety),低价值密度(Value),高速(Velocity)
B、从互联网思维的角度来看,大数据具有三个特征:样本渐趋于总体,精确让位于模糊,相关性重于因果
C、从大数据存储与计算的角度来看,大数据具有两个特征:分布式存储和分布式并行计算
D、以上都不对