- 本知识总结不提供完整的理论体系汇总,旨在给出概念的理解以及各类问题的思考框架。
- 笔记为个人整理,禁止商业用途
- 如有疏漏,欢迎留言
基本概念
- 总体
- 研究对象某个数量指标(随机变量)的全体
- 总体的分布即该随机变量的分布
- 简单随机样本
- 独立同分布(同总体的分布)的随机变量
- 样本值
- 样本的观测数值
- 统计量
- 简单随机样本的函数
- 随机变量的函数
- 抽样分布
- 统计量的分布
- 统计值
- 统计量的观测数值
- 分布的上
分位点 - 该分布的随机变量大于此分位点的概率是
- 该分布的随机变量大于此分位点的概率是
概率论和数理统计的宏观理解
本节不是严格的理论,仅提供各个概念的大致理解,便于记忆繁杂的内容
- 概率论
- 核心问题
- 求总体的分布(随机变量的分布),进而求数字特征(反映总体分布特征的数字)
- 核心步骤
- 定义法计算总体的分布,定义法求数字特征
- 核心问题
- 数理统计
- 核心问题
- 已知样本值,通过各种方法,对总体的参数进行估计(参数估计),对总体的参数满足的性质进行验证(假设检验)
- 矩估计的原理
- 用样本统计值(数字)估计总体的数字特征(数字),从而得到总体的分布
- 极大似然估计
- 让样本的联合密度函数在样本值处取最大,从而估计出总体的参数
- 置信区间的理解(置信度给定)
- 某个数字落在该数字的置信区间的概率,等于置信度
- 统计值和总体参数有各自的置信区间,但是两者和置信区间的位置关系是等价对应的
- 区间估计的原理
- 首先用统计量的分布(带总体参数),求出统计值的置信区间(带总体参数)
- 令统计值落在统计值的置信区间内,求出总体参数的置信区间(估计区间)
- 假设检验的原理
- 在假设成立的基础上,构造统计量,计算置信区间(估计区间)
- 根据置信区间,得到拒绝域(实际处理时一般跳过置信区间直接计算拒绝域)
- 统计值大概率落在统计量的置信区间,小概率落在统计量的拒绝域
- 小概率事件发生,拒绝原假设,否则接受原假设
- 核心问题
常用统计量
- 样本均值
- 样本方差
- 样本标准差
- 样本
阶原点矩 - 样本
阶中心矩 - 第
顺序统计量- 指的是独立同分布样本
中第 大的样本
- 指的是独立同分布样本
统计量的数字特征
一般用的总体的数字特征表示
- 本条指统计量依概率收敛域总体的某个数字特征
常见抽样分布
即统计量的分布
正态分布
- 定义和性质
- 第二章介绍过
- 标准正态分布的上
分位点
卡方分布
- 定义
为卡方分布的自由度
- 卡方分布的上
分位点 - 性质
且两者独立,则
学生分布
- 定义
且两者独立,则 是学生分布的自由度
- 学生分布的上
分位点 - 性质
- 密度函数为偶函数
很大时, 近似是- 利用
- 利用
- 密度函数为偶函数
F分布
- 定义
且两者独立,则 是 分布第一自由度和第二自由度
分布的上 分位点- 性质
正态总体的抽样分布
即总体满足标准正态分布时,各统计量满足的分布 ###
一个正态总体 已知总体
- 样本均值
和样本方差 独立 - 统计量
- 分布
- 原理
- 正态分布的标准化
- 分布
- 统计量
- 分布
- 原理
- 卡方分布的定义
- 分布
- 统计量
- 分布
- 原理
比 自由度少1
- 分布
- 统计量
- 分布
- 原理
分布的定义
- 分布
- 统计量
- 分布
- 原理
- 分布
两个正态总体
已知总体
相互独立- 统计量
- 分布
- 原理
- 正态分布的标准化
- 分布
- 统计量
- 分布
- 原理
- 卡方分布的性质
- 分布
- 当
,统计量- 分布
- 原理
分布的定义
- 分布
- 统计量
- 分布
- 原理
分布的定义
- 分布