\[\begin{align*}
\newcommand{\dif}{\mathop{}\!\mathrm{d}}
\newcommand{\p}{\partial}
\newcommand{\Cov}{\text{Cov}}
\end{align*}\]
概率是从上帝视角来看,而统计则是从凡人视角来看。
基本概念
- 总体 $X$
- 研究对象的全体
- 个体
- 总体中的成员
- 总体的容量
- 总体中包含的个体数。根据容量的多少可以分为:有限总体 和 无限总体。
- 样本 $X_i$
- 从总体中抽取的一个或多个个体
- 简单随机样本
- 满足以下两个条件的随机样本 $(X_1,X_2,\cdots,X_n)$ 称为容量为 $n$ 的简单随机样本
- (1)代表性:每个样本 $X_i$ 与总体 $X$ 同分布;
- (2)独立性:$X_1,X_2,\cdots,X_n$ 是相互独立的随机变量。
对于有限总体,可以采用放回抽样。而对于无限总体,不放回抽样近似于放回抽样,故可以用不放回抽样。
统计与概率的区别
统计量
从样本中提取有用的信息来研究总体分布和特征数的过程,称为构造统计量。
- 统计量
- 样本的不含任何未知参数的函数。设 $(X_1,\cdot,X_n)$ 为样本,若 $g(X_1,\cdots,X_n)$ 不含任何未知数,则称为统计量。
常用统计量:
- 样本均值:$\bar{X}=\frac{1}{n}\sum_{i=1}^n X_i$
- 样本方差:$S^2=\frac{1}{n-1}\sum_{i=1}^n (X_i-\bar{X})^2$(注意是 n-1,与前面的方差不同)
- 样本标准差:$S=\sqrt{S^2}$
- k 阶矩(k阶原点矩):$A_k=\frac{1}{n}\sum_{i=1}^n X_i^k$,$k=1$ 时就是均值
- k 阶中心矩:$B_k=\frac{1}{n}\sum_{i=1}^n (X_i-\bar{X})^k$,$k=2$ 时 不 是方差
扩展阅读:计算样本方差时为什么是除以(n-1)?