logo

统计学知识

王哲峰 / 2022-05-07


目录

概述

整理一下统计学中常用的概念、方法论. 作为一个统计学出身的人, 遇到这些问题时希望不要被难倒

内容大致包含:

大数定律与中心极限定理

在统计学中, 大数定律又称大数法则、大数率, 是描述相当多次数重复实验的结果的定律; 根据这个定律, 样本数量越多, 则其算术平均值就有越高的概率接近期望值.

大数定律

$\xi_1, \xi_2,...,\xi_n,...$ 是随机变量序列, 令

$$\eta_{n} = \frac{\xi_1+\xi_2+...+\xi_n}{n}$$

若存在常数序列 $a_1,a_2,...,a_n,...$ 对任何的正数 $\epsilon$, 恒有

$$\lim\limits_{n \to \infty}P(|\eta_n-a_n|<\epsilon)=1$$

则称序列 ${\epsilon_n}$ 服从 大数定律(或大数法则).

切比雪夫(Chebyishev)不等式

切比雪夫定理的特殊情况

伯努利大数定理

辛钦大数定理

中心极限定理

对于独立随机变量序列 $\xi_1, \xi_2,...,\xi_n,...$, 假定 $E(\xi_n)$$D(\xi_n)$ 都存在, 令

$$\zeta_n=\frac{\sum_{i=1}^{n}\xi_i-\sum_{i=1}^{n}E(\xi_i)}{\sqrt{\sum_{i=1}^{n}}}$$

$$\lim\limits_{n \to \infty}P(\zeta_n < x)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x}e^{\frac{-t^2}{2}}dt$$

则称序列 ${\xi_n}$ 服从 中心极限定理(Central Limit Theorem).

同分布的中心极限定理

德莫佛-拉普拉斯定理

统计推断理论

抽样分布

参数估计

点估计

区间估计

偏度、峰度

偏度

$$Skew(x) = E[(\frac{(X-\mu)^{3}}{\sigma})] = \frac{E(X^{3})-3\mu \sigma^{2} - \mu^{3}}{\sigma^{3}}$$

峰度

峰度(Kurtosis)是描述数据分布陡峭或平滑的统计量, 通过对峰度的计算, 能够判定数据分布相对于正态分布而言是更陡峭还是平缓. 对于随机变量 $X$, 其峰度为样本的四阶标准中心矩

$$Kurt(x) = E[(\frac{(X-\mu)^{4}}{\sigma})] = \frac{E[(X-\mu)^4]}{(E[[(X-\mu)^2]])^2}$$

回归分析

回归分析简介

回归分析理论

参考