考虑下面的回归模型:
=-66.1058+0.0650Xir2=0.9460
se=(10.7509) ( ) n=20
t=( ) (18.73)
完成空缺。如果α=5%,能否接受假设:真实的B2为零?你是用单边检验还是双边检验,为什么?
下面数据是依据10组X和Y的观察值得到的: ∑Yi=1110,∑Xi=1680,∑XiYi=204200 假定满足所有的经典线性回归
下面数据是依据10组X和Y的观察值得到的:
∑Yi=1110,∑Xi=1680,∑XiYi=204200
假定满足所有的经典线性回归模型的假设。求:
根据某地区2001-2011年农作物种植面积(x)与农作物产值(y),可以建立一元线性回归模型,估计结果得到判定系数R2=0.9,回归平方和SSR=90,则回归模型的残差平方和SSE为()。
表3-1为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值(括号内为p-值,即以对应的t统计量为临界值的置信度α)(如果某项为空,则意味着模型中没有此变量)。数据为美国40个城市的数据。模型如下:
Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+β7X7+μ其中,Y为实际颁发的建筑许可证数量,X1为每平方英里(1平方英里=2.59平方千米)的人口密度,X2为自有房屋的均值(单位:百美元),X3为平均家庭的收入(单位:千美元),X4为1980—1992年的人口增长百分比,X5为失业率,X6为人均交纳的地方税,X7为人均缴纳的州税。
表3-1 | ||||
变量 | 模型A | 模型B | 模型C | 模型D |
C | 813(0.74) | 392(0.81) | -1279(0.34) | -973(0.44) |
X1 | 0.075(0.43) | 0.062(0.32) | 0.042(0.47) | |
X2 | -0.855(0.13) | -0.873(0.11) | -0.994(0.06) | 0.778(0.07) |
X3 | 110.41(0.14) | 133.03(0.04) | 125.71(0.05) | 116.60(0.06) |
X4 | 26.77(0.11) | 29.19(0.06) | 29.41(0.001) | 24.86(0.08) |
X5 | -76.55(0.48) | |||
X6 | 0.061(0.95) | |||
X7 | -1.006(0.40) | -1.004(0.37) | ||
RSS | 4.763×107 | 4.843×107 | 4.962×107 | 5.038×107 |
R2 | 0.349 | 0.338 | 0.322 | 0.312 |
hat{sigma }^2 | 1.488×106 | 1.424×106 | 1.418×106 | 1.399×106 |
AIC | 1.776×106 | 1.634×106 | 1.593×106 | 1.538×106 |
1)检验模型A中的每一个回归系数在10%水平下是否为零(括号中的值为双边备择p-值)。根据检验结果,你认为应该把变量保留在模型中还是去掉?
(2)在模型A中,在10%水平下检验联合假设H0:bi =0(i=1,5,6,7)。说明被择假设,计 算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的结论。
(3)哪个模型是“最优的”?解释你的选择标准。
(4)说明最优模型中有哪些系数的符号是“错误的”。说明你的预期符号并解释原因。确认 其是否为正确符号
在一项调查大学生一学期平均成绩(y)与每周在学习(X1)、睡觉(X2)、娱乐(X3)与其他各种活动(X4)所用时间的关系的研究中,建立如下回归模型:
Y=β0+β1X1+β2X2+β3X3+β4X4+μ
如果这些活动所用时间的总和为一周的总小时数168。问:保持其他变量不变,而改变其中一个变量的说法是否有意义?该模型是否有违背基本假设的情况?如何修改此模型以使其更加合理?
下表给出了三变量模型的回归结果:
变异来源 | 平方和(SS) | 自由度 | 平方和均值(MSS) |
来自回归(ESS) 来自残差(RSS) | 65965 — | — — | — — |
总和(TSS) | 66042 | 14 |