我的想法
- Analysis of Variance
- Chi-squared test
- Simple Linear Regression
- Multiple Regression
- Model Building
- Non-parameter Statistic
- Time-Series Analysis
- Statistical Process Control
- Decision Analysis
所有例题大盘点
14.1 投资于股票市场的比例
14.2 比较维修缓冲器的作用
14.3 比较降低胆固醇的药物
15.1 检验市场份额
15.2 大学学位与 MBA 专业之间的关系
16.1 工作年限和年终奖
16.2 里程数和二手丰田凯美瑞的价格 I
一百个数据,自变量为里程数,因变量为价格,要会算自变量的方差和协方差:
协方差:
方差:
斜率计算:
可以得出回归方程
16.3 里程数和二手丰田凯美瑞的价格 II
通过计算标准误,评价拟合效果
标准误:
估计标准误:
用来直接输出标准误。 最小值可以是 0,那么 这个时候所有的点都在回归直线上,说明 越小,拟合效果越好。
16.4 里程数和二手丰田凯美瑞的价格相关吗?
如何验证假设是否为真。需要计算出检验统计量 然和用 来计算出对应的值。
然后用这个值算出检验统计量:
双尾检验的拒绝域为
16.5 衡量里程数和二手车价格线性关系的强度
记住公式:
是所谓的判定系数。可以用来衡量线性关系的强弱。
16.6 衡量里程数和二手车价格线性关系的强度
检验是否呈线性相关:
相关系数为:
检验统计量为:
(用来检验二元正态分布)
16.7 估计二手车的平均价格并预测
感觉不是很重要嗷,如果真的遇见就直接套公式,会有一个专门的预测公式
需要注意的是,预测区间和置信区间并不是一个东西,详情见: https://juejin.cn/post/7116376552513732616
在十六章的最后还涉及到了回归诊断的说明,但是并没有相关的例题。
17.1 圣诞周缆车票销售情况
建立的多元回归模型:参考:Multiple Regression
通过找附录,找 和 计算出 DW 统计量,因此可以用来判断能否拒绝原假设。
18.1 为快餐店选址
可能呈现的一个关系:

因为影响的因素很多,很难断言不同变量和总收益/变量之间是否会有何种关系。
因此直接建模为:
18.2 为快餐店选址 II
用计算器直接输出拟合结果 了
18.3 工资平等:同工同酬

19.1 威尔克科森秩和检验
两个样本,不同观测值,在 5% 的显著性水平下判断总体
秩,即为排序,最小的为 1,最大的为 6。
秩和,即将所有的排序加起来得到 和
当样本量大于 10 的时候,检验统计量就服从正态分布:
检验统计量为:
19.2 止痛药的疗效
两种药物,不同的疗效,(一种是新药一种是旧的)
注意,当排名相同的时候,比如有 3 个“1”,时,也就是三个数据占据第一名到第三名,此时此刻,求平均值,也就是第二名。
当备择假设( )为总体 1 的位置在总体 2 位置的右边的时候,拒绝域: ,就是希望看 是否足够大到我们可以拒绝原假设而反而去接受备择假设。
19.3 留住员工
注意,题设的备择假设( )为“总体 1 和总体 2 的位置不同”,所以拒绝域是 或者
19.4 两款中型车舒适度比较
由于是同样的 n 个人评价两个总体,所以应该设计为配对实验,使用符号检验。
在符号检验中,一般会把插值为 0 的配对观测值去掉,因此, 是样本中非零差值的个数。
19.5 “弹性工作制”和“固定时间工作制”的比较
考察的是 Wilcoxon Signed Rank Sum Test,当 的时候可以被定义为大样本,此时 服从正态分布,均值为:
标准差为:

19.6 比较经理对应聘者的评估结果
有八名应聘者,而有四名经理对他们进行评估,用 Friedman Test 来验证是否是评估系统出现了问题(也就是经理之间的评分是否有显著差异)
备择假设为::至少有两个总体的位置不同。
通过跨行移动来确定秩。(横着看)
19.7 检验工人能力测验得分和表现之间的关系
问题的目标是分析两个变量之间的关系。需要用到Spearman rank correlation coefficient
需要计算秩的协方差
单个样本的协方差是:
20.1 汽油销量 I
来到这道题,也就正式进入了时间序列!需要运用到的方法有 Moving Averages,
移动平均值,即不断地替换
注意四期移动平均值和四期中心移动平均值的结果是不一样的
20.2 汽油销量 II
指数平滑法(一般是给了 的)
20.3 旅馆季度入住率
计算指数。通过剔除入住率的季节效应,得到真正的增长或者下降
20.4 预测模型的比较
20.5 预测旅馆入住率
得出了趋势线方程之后,直接算出预测值
算出四个季度的预测值(根据季节指数)
个人理解:根据季节指数调整趋势线,得到预测值
20.6 预测消费价格指数的变化
好像无法手算,遂罢。
21.1 李尔公司的统计过程控制 I
每小时随机抽取 4 根弹簧
中线=
控制上下限 =
S 是联合标准差
21.2 李尔公司的统计过程控制 II
无
21.3 李尔公司的统计过程控制 III
没有讲这个