fleeting

我的想法

所有例题大盘点

14.1 投资于股票市场的比例

14.2 比较维修缓冲器的作用

14.3 比较降低胆固醇的药物

15.1 检验市场份额

15.2 大学学位与 MBA 专业之间的关系

16.1 工作年限和年终奖

16.2 里程数和二手丰田凯美瑞的价格 I

一百个数据,自变量为里程数,因变量为价格,要会算自变量的方差和协方差:

协方差:

方差:

斜率计算:

可以得出回归方程

16.3 里程数和二手丰田凯美瑞的价格 II

通过计算标准误,评价拟合效果

标准误:

估计标准误:

用来直接输出标准误。 最小值可以是 0,那么 这个时候所有的点都在回归直线上,说明 越小,拟合效果越好

16.4 里程数和二手丰田凯美瑞的价格相关吗?

如何验证假设是否为真。需要计算出检验统计量 然和用 来计算出对应的值。

然后用这个值算出检验统计量:

双尾检验的拒绝域为

16.5 衡量里程数和二手车价格线性关系的强度

记住公式:

是所谓的判定系数。可以用来衡量线性关系的强弱。

16.6 衡量里程数和二手车价格线性关系的强度

检验是否呈线性相关:

相关系数为:

检验统计量为:

(用来检验二元正态分布

16.7 估计二手车的平均价格并预测

感觉不是很重要嗷,如果真的遇见就直接套公式,会有一个专门的预测公式

需要注意的是,预测区间和置信区间并不是一个东西,详情见: https://juejin.cn/post/7116376552513732616


在十六章的最后还涉及到了回归诊断的说明,但是并没有相关的例题。

17.1 圣诞周缆车票销售情况

建立的多元回归模型:参考:Multiple Regression

通过找附录,找 计算出 DW 统计量,因此可以用来判断能否拒绝原假设。

18.1 为快餐店选址

可能呈现的一个关系:

因为影响的因素很多,很难断言不同变量和总收益/变量之间是否会有何种关系。

因此直接建模为:

18.2 为快餐店选址 II

用计算器直接输出拟合结果

18.3 工资平等:同工同酬

19.1 威尔克科森秩和检验

Wilcoxon Rank Sum Test

两个样本,不同观测值,在 5% 的显著性水平下判断总体

,即为排序,最小的为 1,最大的为 6。

秩和,即将所有的排序加起来得到

当样本量大于 10 的时候,检验统计量就服从正态分布:

检验统计量为:

19.2 止痛药的疗效

两种药物,不同的疗效,(一种是新药一种是旧的)

注意,当排名相同的时候,比如有 3 个“1”,时,也就是三个数据占据第一名到第三名,此时此刻,求平均值,也就是第二名。

当备择假设( )为总体 1 的位置在总体 2 位置的右边的时候,拒绝域: ,就是希望看 是否足够大到我们可以拒绝原假设而反而去接受备择假设。

19.3 留住员工

注意,题设的备择假设( )为“总体 1 和总体 2 的位置不同”,所以拒绝域是 或者

19.4 两款中型车舒适度比较

由于是同样的 n 个人评价两个总体,所以应该设计为配对实验,使用符号检验。

在符号检验中,一般会把插值为 0 的配对观测值去掉,因此, 是样本中非零差值的个数。

19.5 “弹性工作制”和“固定时间工作制”的比较

考察的是 Wilcoxon Signed Rank Sum Test,当 的时候可以被定义为大样本,此时 服从正态分布,均值为:

标准差为:

19.6 比较经理对应聘者的评估结果

有八名应聘者,而有四名经理对他们进行评估,用 Friedman Test 来验证是否是评估系统出现了问题(也就是经理之间的评分是否有显著差异)

备择假设为::至少有两个总体的位置不同。

通过跨行移动来确定秩。(横着看)

符合Chi-squared test

19.7 检验工人能力测验得分和表现之间的关系

问题的目标是分析两个变量之间的关系。需要用到Spearman rank correlation coefficient

需要计算秩的协方差

单个样本的协方差是:

20.1 汽油销量 I

来到这道题,也就正式进入了时间序列!需要运用到的方法有 Moving Averages

移动平均值,即不断地替换

注意四期移动平均值和四期中心移动平均值的结果是不一样的

20.2 汽油销量 II

指数平滑法(一般是给了 的)

20.3 旅馆季度入住率

计算指数。通过剔除入住率的季节效应,得到真正的增长或者下降

20.4 预测模型的比较

20.5 预测旅馆入住率

得出了趋势线方程之后,直接算出预测值

算出四个季度的预测值(根据季节指数)

个人理解:根据季节指数调整趋势线,得到预测值

20.6 预测消费价格指数的变化

好像无法手算,遂罢。

21.1 李尔公司的统计过程控制 I

每小时随机抽取 4 根弹簧

中线=

控制上下限 =

S 是联合标准差

21.2 李尔公司的统计过程控制 II

21.3 李尔公司的统计过程控制 III

没有讲这个


Reference