统计的基础概念

\[\begin{align*} \newcommand{\dif}{\mathop{}\!\mathrm{d}} \newcommand{\p}{\partial} \newcommand{\Cov}{\text{Cov}} \end{align*}\]

概率是从上帝视角来看,而统计则是从凡人视角来看。

基本概念

总体 $X$
研究对象的全体
个体
总体中的成员
总体的容量
总体中包含的个体数。根据容量的多少可以分为:有限总体无限总体
样本 $X_i$
从总体中抽取的一个或多个个体
简单随机样本
满足以下两个条件的随机样本 $(X_1,X_2,\cdots,X_n)$ 称为容量为 $n$ 的简单随机样本
(1)代表性:每个样本 $X_i$ 与总体 $X$ 同分布;
(2)独立性:$X_1,X_2,\cdots,X_n$ 是相互独立的随机变量。

对于有限总体,可以采用放回抽样。而对于无限总体,不放回抽样近似于放回抽样,故可以用不放回抽样。

统计与概率的区别

统计量

从样本中提取有用的信息来研究总体分布和特征数的过程,称为构造统计量。

统计量
样本的不含任何未知参数的函数。设 $(X_1,\cdot,X_n)$ 为样本,若 $g(X_1,\cdots,X_n)$ 不含任何未知数,则称为统计量。

常用统计量:

  1. 样本均值:$\bar{X}=\frac{1}{n}\sum_{i=1}^n X_i$
  2. 样本方差:$S^2=\frac{1}{n-1}\sum_{i=1}^n (X_i-\bar{X})^2$(注意是 n-1,与前面的方差不同)
  3. 样本标准差:$S=\sqrt{S^2}$
  4. k 阶矩(k阶原点矩):$A_k=\frac{1}{n}\sum_{i=1}^n X_i^k$,$k=1$ 时就是均值
  5. k 阶中心矩:$B_k=\frac{1}{n}\sum_{i=1}^n (X_i-\bar{X})^k$,$k=2$ 时 是方差

扩展阅读:计算样本方差时为什么是除以(n-1)?