概率统计

概率统计

概率定义

有如下常用公式

P(AB)=P(A)+P(B)P(AB)P(AB)=P(AB)=1P(AB)\begin{aligned} & P(A\cup B)=P(A)+P(B)-P(AB) \\ & P(\overline{A}\overline{B})=P(\overline{A\cup B}) = 1-P(A\cup B) \end{aligned}

条件概率

条件概率公式

P(BA)=P(AB)P(A)\begin{aligned} P(B|A)=\frac{P(AB)}{P(A)} \end{aligned}

经过变形,可以得到乘法公式

P(AB)=P(A)P(BA)\begin{aligned} P(AB)=P(A)P(B|A) \end{aligned}

全概率公式

P(A)=P(B1)P(AB1)+P(B2)P(AB2)+...+P(Bn)P(ABn)\begin{aligned} P(A)=P(B_1)P(A|B_1)+P(B_2)P(A|B_2)+...+P(B_n)P(A|B_n) \end{aligned}

独立事件

若两个事件相互独立,则

P(AB)=P(A)P(B)\begin{aligned} P(AB)=P(A)P(B) \end{aligned}

一维

泊松分布

是二项分布的极限

XB(n,p)X\sim B(n,p)λ=np\lambda = np,则

P(X=k)=eλλkk!P(Xn)=k=0neλλkk!\begin{aligned} & P(X=k)=e^{-\lambda}\frac{\lambda ^k}{k!} \\ & P(X \le n)=\sum^{n}_{k=0}e^{-\lambda}\frac{\lambda ^k}{k!} \end{aligned}

指数分布

概率密度函数为

f(x)={λeλx,x>00,otherwise f(x)=\left\{ \begin{aligned} \lambda e^{-\lambda x}, \quad x \gt 0\\ 0, \quad otherwise \end{aligned} \right.

分布函数为

F(x)=1eλx\begin{aligned} F(x)=1-e^{-\lambda x} \end{aligned}

正态分布

定义

f(x)=12πσe(xμ)22σ2XN(μ,σ2)\begin{aligned} & f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}} \\ & X \sim N(\mu, \sigma^2) \end{aligned}

分布函数

标准正态分布的分布函数记为Φ(x)\Phi(x),有表可查。

F(x)=Φ(xμσ)P(a<X<b)=F(b)F(a)=Φ(bμσ)Φ(aμσ)P(X>a)=1F(a)=1Φ(aμσ)Φ(x)=1Φ(x)\begin{aligned} & F(x) = \Phi(\frac{x-\mu}{\sigma}) \\ & P(a \lt X \lt b) = F(b) - F(a) = \Phi(\frac{b-\mu}{\sigma}) - \Phi(\frac{a-\mu}{\sigma}) \\ & P(X \gt a) = 1 - F(a) = 1 - \Phi(\frac{a-\mu}{\sigma}) \\ & \Phi(-x)=1-\Phi(x) \end{aligned}

随机变量转换

已知fX(x)f_X(x)Y=g(X)Y=g(X),则YY的概率密度函数为

fY(y)=fX[h(y)]h(y),α<y<β\begin{aligned} f_Y(y)=f_X[h(y)]|h'(y)|, \qquad \alpha \lt y \lt \beta \end{aligned}

其中h(y)h(y)g(x)g(x)的反函数

二维

二维随机变量的分布函数为

F(x,y)=P(Xx,Yy)\begin{aligned} F(x,y)=P(X\le x, Y\le y) \end{aligned}

离散型

独立性

若二维随机变量相互独立,则

P(Xx,Yy)=P(Xx)P(Yy)P(X\le x, Y \le y)=P(X\le x)P(Y\le y)

即可以得到联合分布律与但变量分布律的关系

F(X,Y)=FX(x)FY(y)F(X,Y)=F_X(x)F_Y(y)

P(X=xi,Y=yj)=P(X=xi)P(Y=yj)P(X=x_i , Y=y_j) = P(X=x_i)P(Y=y_j), 即pij=pi.p.jp_{ij} = p_{i.}p_{.j}

连续型

独立性

  1. 第一种方法

    f(x,y)=fX(x)fY(y)\begin{aligned} & f(x,y)=f_X(x)f_Y(y) \end{aligned}

    另外由f(x,y)=fX(x)fYX(yx)f(x,y)=f_X(x)f_{Y|X}(y|x) ,可知若相互独立,则

    fY(y)=fYX(yx)fX(x)=fXY(xy)\begin{aligned} & f_Y(y)=f_{Y|X}(y|x) \\ & f_X(x)=f_{X|Y}(x|y) \end{aligned}

  2. 第二种方法

    f(x,y)=r(x)g(y)and:fX(x)=r(x)+r(x)dx=r(x)+g(y)dyfY(y)=g(y)+g(y)dy=g(y)+r(x)dx\begin{aligned} & f(x,y) = r(x)g(y) \\ & \operatorname{and:} \\ & f_X(x)=\frac{r(x)}{\int^{+\infin}_{-\infin}r(x)dx}=r(x)\int^{+\infin}_{-\infin}g(y)dy \\ & f_Y(y)=\frac{g(y)}{\int^{+\infin}_{-\infin}g(y)dy}=g(y)\int^{+\infin}_{-\infin}r(x)dx \end{aligned}

  3. 推论

    U=u(x),V=v(x)U=u(x), V=v(x)

    FUV(u,v)=FU(u)FV(v)\begin{aligned} & F_{UV}(u,v) = F_U(u)F_V(v) \\ \end{aligned}

    举例来说,若X,YX,Y相互独立,则aX+b,cY+daX+b, cY+d也相互独立

边缘分布律

二维随机变量X,YX,Y关于某一分量的边缘分布函数指X或Y作为一元随机变量时的分布函数,

FX(x)=P(Xx),FY(y)=P(Yy)FX(x)=P(Xx,Y<+)=F(X,+)\begin{aligned} & F_X(x)=P(X\le x), F_Y(y)=P(Y \le y) \\ & F_X(x)=P(X\le x, Y \lt +\infin) = F(X, +\infin) \end{aligned}

不等式

  • 马尔科夫不等式

P(Xa)E(Xk)ak\begin{aligned} P(|X| \ge a) \le \frac{E(|X|^k)}{a^k} \end{aligned}

数字特征

数学期望

离散型:

P(X=xk)=pk,k=1,2,...E(X)=k=1+xkpkifY=g(X):E(g(X))=k=1+g(xk)pk\begin{aligned} & P(X=x_k) = p_k, \qquad k=1,2,... \\ & E(X) = \sum^{+\infin}_{k=1}x_kp_k \\ & \operatorname{if} \quad Y=g(X): \\ & E(g(X)) = \sum^{+\infin}_{k=1}g(x_k)p_k \end{aligned}

连续性:

E(X)=+xf(x)dxifY=g(X):E(g(X))=+g(x)f(x)dx\begin{aligned} & E(X) = \int^{+\infin}_{-\infin}xf(x)dx \\ & \operatorname{if} \quad Y = g(X): \\ & E(g(X)) = \int^{+\infin}_{-\infin}g(x)f(x)dx \end{aligned}

二维连续型:

E(X)=++xf(x,y)dxdyE(Y)=++yf(x,y)dxdyE(g(X,Y))=++g(x,y)f(x,y)dxdy\begin{aligned} & E(X) = \int^{+\infin}_{-\infin} \int^{+\infin}_{-\infin}xf(x,y)dxdy \\ & E(Y) = \int^{+\infin}_{-\infin} \int^{+\infin}_{-\infin}yf(x,y)dxdy \\ & E(g(X,Y)) = \int^{+\infin}_{-\infin} \int^{+\infin}_{-\infin}g(x,y)f(x,y)dxdy \end{aligned}

常见数学期望表:

分布 期望
0-1分布 pp
B(n,p)B(n,p) npnp
P(λ)P(\lambda) λ\lambda
均匀分布 a+b2\frac{a+b}{2}
E(λ)E(\lambda) 1λ\frac{1}{\lambda}
N(μ,σ)N(\mu, \sigma) μ\mu

性质:

E(aX)=aE(x)E(X+Y)=E(X)+E(Y)E(i=1nXi)=i=1nE(Xi)\begin{aligned} & E(aX) = aE(x) \\ & E(X+Y) = E(X) + E(Y) \\ & E(\sum^n_{i=1}X_i)=\sum^n_{i=1}E(X_i) \\ \end{aligned}

如果X和Y相互独立

E(XY)=E(X)E(Y)\begin{aligned} & E(XY) = E(X)E(Y) \end{aligned}

方差

概念

D(X)=E((XE(X))2)D(X) = E((X-E(X))^2),即随机变量X的取值偏离平均值的平均偏离程度

离散型变量:

P(X=xk)=pk,k=1,2,...D(X)=k=1+(xkE(X))2pk\begin{aligned} & P(X=x_k) = p_k, \quad k=1,2,... \\ & D(X) = \sum^{+\infin}_{k=1}(x_k - E(X))^2p_k \end{aligned}

连续型变量:

D(X)=+(xE(X))2f(x)dx\begin{aligned} & D(X) = \int^{+\infin}_{-\infin}(x-E(X))^2f(x)dx \end{aligned}

常用公式

D(X)=E(X2)E2(X)\begin{aligned} & D(X) = E(X^2) - E^2(X) \end{aligned}

常用方差表

分布 方差
0-1分布 p(1p)p(1-p)
B(n,p)B(n,p) np(1p)np(1-p)
P(λ)P(\lambda) λ\lambda
均匀分布 (ba)212\frac{(b-a)^2}{12}
E(λ)E(\lambda) 1λ2\frac{1}{\lambda^2}
N(μ,σ)N(\mu, \sigma) σ2\sigma^2

性质

D(aX)=a2D(X)D(aX+b)=a2D(X)D(aX±bY)=a2D(X)+b2D(Y)±2abE((XE(X))(YE(Y)))=D(X)+D(Y)±2ab(E(XY)E(X)E(Y))=D(X)+D(Y)±2abcov(X,Y)\begin{aligned} & D(aX) = a^2D(X) \\ & D(aX+b) = a^2D(X) \\ & D(aX\pm bY) = a^2D(X) + b^2D(Y) \pm 2abE((X-E(X))(Y-E(Y))) \\ & \qquad= D(X) + D(Y) \pm 2ab(E(XY)-E(X)E(Y)) \\ & \qquad= D(X) + D(Y) \pm 2ab\operatorname{cov}(X,Y) \end{aligned}

如果X和Y相互独立,则有

D(X±Y)=D(X)+D(Y)D(i=1naiXi)=i=1nD(aiXi)=i=1nai2D(Xi)\begin{aligned} & D(X \pm Y) = D(X) + D(Y) \\ & D(\sum^n_{i=1}a_iX_i)=\sum^n_{i=1}D(a_iX_i)=\sum^n_{i=1}a_i^2D(X_i) \end{aligned}

协方差

定义

试图定义一种新的量,来反映随机变量(X,Y)(X,Y)之间的某种联系

cov(X,Y)=E((XE(X))(YE(Y)))=E(XY)E(X)E(Y)\begin{aligned} \operatorname{cov}(X,Y)=E((X-E(X))(Y-E(Y))) = E(XY)-E(X)E(Y) \end{aligned}

相关系数:

ρXY=cov(X,Y)D(X)D(Y)\begin{aligned} \rho_{XY}=\frac{\operatorname{cov}(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}} \end{aligned}

若相关系数为0,则称(X,Y)(X,Y)不相关

性质

cov(aX,bY)=abcov(X,Y)cov(X+Y,Z)=cov(X,Z)+cov(Y,Z)\begin{aligned} & \operatorname{cov}(aX, bY)=ab\operatorname{cov}(X,Y) \\ & \operatorname{cov}(X+Y, Z)=\operatorname{cov}(X,Z)+\operatorname{cov}(Y,Z) \end{aligned}

中心极限定理

对于随机分布序列X1,X2,...,XnX_1, X_2, ..., X_n,无论XX服从什么分布,当n足够大时,XiX_i均服从正态分布

且对于Yn=Y(X1,X2,...Xn)Y_n=Y(X_1,X_2,...X_n),有

YnE(Yn)D(Yn)N(0,1)limnP(YnE(Yn)D(Yn)y)=Φ(y)\begin{aligned} & \frac{Y_n-E(Y_n)}{\sqrt{D(Y_n)}}\sim N(0,1) \\ & \lim_{n\rightarrow \infin}P(\frac{Y_n-E(Y_n)}{\sqrt{D(Y_n)}} \le y) = \Phi(y) \end{aligned}

注意σ\sigma是标准差,σ2\sigma^2是方差

若对Xi,P(Xi=1)=p\forall X_i, P(X_i=1)=p,即服从0-1分布,那么

Yn=i=1nXiB(n,p)YnN(np,np(1p))\begin{aligned} & Y_n = \sum^n_{i=1}X_i \sim B(n,p) \\ & Y_n \sim N(np, np(1-p)) \end{aligned}

统计量分布

常用统计量

样本均值

X=1ni=1nXi\begin{aligned} & \overline{X}=\frac{1}{n}\sum^n_{i=1}X_i \\ \end{aligned}

样本方差

S2=1n1i=1n(XiX)2\begin{aligned} & S^2=\frac{1}{n-1}\sum^n_{i=1}(X_i-\overline{X})^2 \\ \end{aligned}

k阶原点矩

Ak=1ni=1nXik\begin{aligned} & A_k=\frac{1}{n}\sum^n_{i=1}X_i^k \\ \end{aligned}

k阶中心矩

Bk=1ni=1n(XiX)k\begin{aligned} & B_k=\frac{1}{n}\sum^n_{i=1}(X_i-\overline{X})^k \end{aligned}

常用统计量有如下一些结论。设E(X)=μ,D(X)=σ2E(X)=\mu, D(X)=\sigma^2

E(X)=μ=E(X)D(X)=σ2n=D(X)n\begin{aligned} & E(\overline{X})=\mu=E(X) \\ & D(\overline{X})=\frac{\sigma^2}{n}=\frac{D(X)}{n} \end{aligned}

另外,对于样本方差和2阶中心矩有如下结论:

S2=nn1Sn2Sn2=1ni=1n(XiX)2=1ni=1n(Xi22XiX+X2)=1n(i=1nXi22Xi=1nXi+i=1nX2)=1n(i=1nXi22nX2+nX2)=1n(i=1nXi2nX2)=1ni=1nXi2X2E(Sn2)=E(1ni=1nXi2)E(X2)=1ni=1nE(Xi2)[D(X)+E2(X)]=1ni=1n(σ2+μ2)σ2nμ2=σ2+μ2σ2nμ2=n1nσ2E(S2)=nn1n1nσ2=σ2D(S2)=D[(n1)S2σ2σ2n1]=(σ2n1)2D((n1)S2σ2)=(σ2n1)2D(χ2(n1))=(σ2n1)2(2n2)=2σ4n1D(Sn2)=D(n1nS2)=(n1n)22σ4n1=2(n1)σ4n2\begin{aligned} & S^2=\frac{n}{n-1}S_n^2 \\ & S_n^2=\frac{1}{n}\sum^n_{i=1}(X_i-\overline X)^2 \\ & \quad =\frac{1}{n}\sum^n_{i=1}(X_i^2 - 2X_i \overline X + \overline X^2) \\ & \quad =\frac{1}{n}(\sum^n_{i=1}X_i^2 - 2\overline X\sum^n_{i=1}X_i + \sum^n_{i=1} \overline X^2) \\ & \quad =\frac{1}{n}(\sum^n_{i=1}X_i^2 - 2n\overline X^2 + n\overline X^2) \\ & \quad =\frac{1}{n}(\sum^n_{i=1}X_i^2 - n\overline X^2) \\ & \quad =\frac{1}{n}\sum^n_{i=1}X_i^2 - \overline X^2 \\ & \therefore E(S_n^2)=E(\frac{1}{n}\sum^n_{i=1}X_i^2) - E(\overline X^2) \\ & \qquad \qquad = \frac{1}{n}\sum^n_{i=1}E(X_i^2) - [D(\overline X) + E^2(\overline X)] \\ & \qquad \qquad = \frac{1}{n}\sum^n_{i=1}(\sigma^2 + \mu^2) - \frac{\sigma^2}{n} - \mu^2 \\ & \qquad \qquad = \sigma^2 + \mu^2 - \frac{\sigma^2}{n} - \mu^2 \\ & \qquad \qquad = \frac{n-1}{n}\sigma^2 \\ & \therefore E(S^2) = \frac{n}{n-1} \frac{n-1}{n}\sigma^2 = \sigma^2 \\ & \\ & D(S^2)=D[\frac{(n-1)S^2}{\sigma^2}\frac{\sigma^2}{n-1}] \\ & \qquad =(\frac{\sigma^2}{n-1})^2D(\frac{(n-1)S^2}{\sigma^2}) \\ & \qquad =(\frac{\sigma^2}{n-1})^2D(\chi^2(n-1)) \\ & \qquad =(\frac{\sigma^2}{n-1})^2(2n-2) \\ & \qquad = \frac{2\sigma^4}{n-1} \\ & D(S_n^2) = D(\frac{n-1}{n}S^2) \\ & \qquad = (\frac{n-1}{n})^2\frac{2\sigma^4}{n-1} \\ & \qquad =\frac{2(n-1)\sigma^4}{n^2} \end{aligned}

样本均值

若总体XX服从正态分布N(μ,σ2)N(\mu, \sigma^2),那么从中抽取样本量为nn的样本X1,X2,...,XnX_1, X_2,...,X_n样本均值X\overline{X}

X=1ni=1nXi\begin{aligned} & \overline{X}=\frac{1}{n}\sum^n_{i=1}X_i \end{aligned}

也服从正态分布,且

XN(μ,σ2n)\begin{aligned} \overline{X} \sim N(\mu, \frac{\sigma^2}{n}) \end{aligned}

其他统计量的分布

  • χ2\chi^2分布

    X1,X2,...,XnX_1, X_2, ..., X_n是来自正态总体N(0,1)N(0,1)的样本,则统计量χ2\chi^2

    χ2=i=1nXi2χ2χ2(n)E(χ2(n))=n,D(χ2(n))=2n\begin{aligned} & \chi^2=\sum^n_{i=1}X_i^2 \\ & \chi^2 \sim \chi^2(n) \\ & E(\chi^2(n))=n, D(\chi^2(n))=2n \end{aligned}

    对于样本方差S2S^2,满足:

    (n1)S2σ2χ2(n1)S2=1n1i=1n(XiX)21σ2i=1n(XiX)2χ2(n1)\begin{aligned} & \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) \\ & \because S^2 = \frac{1}{n-1}\sum^n_{i=1}(X_i-\overline X)^2 \\ & \therefore \frac{1}{\sigma^2}\sum^n_{i=1}(X_i-\overline X)^2 \sim \chi^2(n-1) \end{aligned}

  • tt分布

    XN(0,1),Yχ2(n)X\sim N(0,1), Y \sim \chi^2(n)X,YX,Y相互独立,则统计量TT

    T=XY/nTt(n)\begin{aligned} & T = \frac{X}{\sqrt{Y/n}} \\ & T \sim t(n) \end{aligned}

  • FF分布

    Xχ2(m),Yχ2(n)X\sim \chi^2(m), Y\sim \chi^2(n),且X,YX,Y相互独立,则统计量FF

    F=X/mY/nFF(m,n)\begin{aligned} & F=\frac{X/m}{Y/n} \\ & F \sim F(m,n) \end{aligned}

    F(m,n)F(m,n)α\alpha分位数Fα(m,n)F_\alpha(m,n)有表可查

    P(FFα(n,m))=αF1α(n,m)=1Fα(m,n)\begin{aligned} & P(F\le F_\alpha(n,m))=\alpha \\ & F_{1-\alpha}(n,m) = \frac{1}{F_\alpha}(m,n) \end{aligned}

点估计

矩估计法

即用样本矩来估计总体矩

求解过程:

E(X)=1ni=1nXi=XE(X2)=D(X)+E2(X)=1ni=1nXi2\begin{aligned} & E(X) = \frac{1}{n}\sum^n_{i=1}X_i=\overline X \\ & E(X^2) = D(X) + E^2(X) = \frac{1}{n}\sum^n_{i=1}X_i^2 \end{aligned}

联立(1)(2)两式,其中E(X)E(X)E(X2)E(X^2)均用未知量表示,最终解得的结果是关于X\overline{X}XiX_i的函数

真搞懂啦~

极大似然估计法

  • 求解过程:

    宗旨是让LL尽可能大

    假设XX符合的分布有与θ1,θ2,...,θk\theta_1, \theta_2, ..., \theta_k有关,x1,x2,...,xnx_1, x_2, ..., x_nXX的一组样本值

    1. 写出似然函数LL

    2. LL求的多个参数依次求偏导,一般来说可以对lnL\ln L求偏导。

    L(x1,x2,...,xn;θ1,θ2,...,θk)=i=1nf(xi;θ1,...,θk)θjlnL=0,r=1,2,...,k\begin{aligned} & L(x_1, x_2, ..., x_n; \theta_1, \theta_2, ..., \theta_k) = \prod^n_{i=1}f(x_i;\theta_1,...,\theta_k) \\ & \frac{\partial}{\partial\theta_j}\ln L=0, \quad r=1,2,...,k \\ \end{aligned}

    1. 根据以上求得的极大似然估计值,求极大似然估计量,即用XX替换xx

      LL对于θ\theta不是可微的或偏导数=0无解,那么要考察θ\thetaLL的相关性。

      θ\theta越大LL越大,则θ\theta取能取到的最大值

      θ\theta越大LL越小,则θ\theta取能取到的最小值

      或根据f(x)f(x)xx的范围确定θ\theta

  • 不变性原理

    θ^\hat\thetaθ\theta的极大似然估计值,那么u(θ)^=u(θ^))\widehat{u(\theta)} = u(\hat\theta))

点估计的评价方法

无偏性

对于总体参数θ\theta,若其估计量为θ^\hat\theta,且

E(θ^)=θE(\hat\theta)=\theta

θ^\hat\thetaθ\theta的无偏估计量

  • 主要运用数学期望的性质进行计算

有效性

θ^1\hat\theta_1θ^2\hat\theta_2都是总体参数θ\theta的估计量,若

D(θ^1)<D(θ^2)\begin{aligned} D(\hat\theta_1) \lt D(\hat\theta_2) \end{aligned}

θ^1\hat\theta_1θ^2\hat\theta_2更有效

  • 主要运用方差的性质进行计算
  • 算数均值是所有线性无偏估计中方差最小的

一致性

也称“依概率收敛”,具体表示为:若当nn \rightarrow \infin时,θ^θ\hat\theta \rightarrow \theta,即

limxP{θ^θϵ}=0\begin{aligned} & \lim\limits_{x\rightarrow\infin}P\{\lvert\hat\theta - \theta\rvert\ge\epsilon\}=0 \end{aligned}

更常用的形式是

limxP{θ^θ<ϵ}=1\begin{aligned} & \lim\limits_{x\rightarrow\infin}P\{\lvert\hat\theta - \theta\rvert\lt\epsilon\}=1 \end{aligned}

具体做题时,可借助切比雪夫不等式:

P{XE(X)<ϵ}1D(X)ϵ2\begin{aligned} & P\{\lvert X-E(X)\rvert\lt\epsilon\} \ge 1-\frac{D(X)}{\epsilon^2} \end{aligned}

如果可证θ^\hat\theta的无偏性,那么

1P{θ^θ<ϵ}1D(X)ϵ2\begin{aligned} & 1 \ge P\{\lvert\hat\theta-\theta\rvert\lt\epsilon\}\ge 1-\frac{D(X)}{\epsilon^2} \end{aligned}

在应用夹逼定理,即可证极限为1

区间估计

对于一个正态总体XN(μ,σ2)X\sim N(\mu, \sigma^2)

  1. σ2\sigma^2已知,μ\mu的置信区间,置信度1α1-\alpha

Z=Xμσ2nN(0,1)P(Zzα2)=1αP(Xzα2σn<μ<X+zα2σn)=1α\begin{aligned} & Z=\frac{\overline{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}} \sim N(0,1) \\ & \\ & P(\lvert Z \rvert \le z_{\frac{\alpha}{2}}) = 1-\alpha \\ & \\ & P(\overline{X}-z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}} \lt \mu \lt \overline{X}+z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}})=1-\alpha \end{aligned}

  1. σ2\sigma^2未知,μ\mu的置信区间

T=XμS2nT(n1)P(Ttα2(n1))=1αP(Xtα2(n1)Sn<μ<X+tα2(n1)Sn)=1α\begin{aligned} & T = \frac{\overline{X}-\mu}{\sqrt{\frac{S^2}{n}}} \sim T(n-1) \\ & \\ & P(\lvert T \rvert \le t_{\frac{\alpha}{2}}(n-1)) = 1-\alpha \\ & \\ & P(\overline{X}- t_{\frac{\alpha}{2}} (n-1) \frac{S}{\sqrt{n}}\lt \mu \lt \overline{X}+t_{\frac{\alpha}{2}}(n-1)\frac{S}{\sqrt{n}})=1-\alpha \end{aligned}

  1. μ\mu已知,σ2\sigma^2的置信区间

Q=i=1n(Xiμσ)2χ2(n)P(χα22(n)<Q<χ1α22(n))=1αP(i=1n(Xiμ)2χα22(n)<σ2<i=1n(Xiμ)2χ1α22(n))=1α\begin{aligned} & Q=\sum^n_{i=1}(\frac{X_i-\mu}{\sigma})^2 \sim \chi^2(n) \\ & \\ & P(\chi^2_{\frac{\alpha}{2}}(n) \lt Q \lt \chi^2_{1-\frac{\alpha}{2}}(n)) = 1-\alpha\\ & \\ & P(\frac{\sum^n_{i=1}(X_i - \mu)^2}{\chi^2_{\frac{\alpha}{2}}(n)} \lt \sigma^2 \lt \frac{\sum^n_{i=1}(X_i - \mu)^2}{\chi^2_{1-\frac{\alpha}{2}}(n)})=1-\alpha \end{aligned}

  1. μ\mu未知,σ2\sigma^2的置信区间

K=(n1)S2σ2χ2(n1)P(χα22(n1)<K<χ1α22(n1))=1αP((n1)S2χα22(n1)<σ2<(n1)S2χ1α22(n1))=1α\begin{aligned} & K=\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) \\ & \\ & P(\chi^2_{\frac{\alpha}{2}}(n-1) \lt K \lt \chi^2_{1-\frac{\alpha}{2}}(n-1))=1-\alpha \\ & \\ & P(\frac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)} \lt \sigma^2 \lt \frac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)})=1-\alpha \end{aligned}

假设检验

单个总体均值

α\alpha的含义:Xμ0X-\mu_0的值非常大(小),大到其发生的概率只有α\alphaα\alpha通常只有0.05或0.01

标准差已知时用U检验法

标准差未知时用T检验法

两个总体均值

设样本XXn1n_1个,YYn2n_2个,且来自的总体的方差均为σ2\sigma^2,那么检验统计量变为

t=XYSw1n1+1n2\begin{aligned} t=\frac{\overline{X}-\overline{Y}}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \end{aligned}

其中Sw2S_w^2为两个总体方差的加权平均

Sw2=(n11)S12+(n21)S22n1+n22\begin{aligned} S_w^2 = \frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} \end{aligned}

拒绝与可参照上面两个表格

单个总体方差

S2σ02\frac{S^2}{\sigma_0^2}非常大(小),大到其发生的概率只有α\alphaα\alpha通常非常小,只有0.01或0.05

均值已知

均值未知

例题

  1. 将4个可区分的球随机的放入4个盒子,求空盒子数量的数学期望

    XX为空盒子数量,XiX_i为第i个盒子是否为空。可得X=X1+X2+X3+X4X=X_1+X_2+X_3+X_4

    对于XiX_i

    P(Xi=1)=(34)4P(Xi=0)=1(34)4E(Xi)=(34)4 \begin{aligned} & P(X_i=1)=(\frac{3}{4})^4 \\ & P(X_i=0)=1-(\frac{3}{4})^4 \\ & \\ & \therefore E(X_i)=(\frac{3}{4})^4 \end{aligned}

    因此

    E(X)=E(i=14Xi)=i=14E(Xi)=4×(34)4 \begin{aligned} E(X)=E(\sum^4_{i=1}X_i)=\sum^4_{i=1}E(X_i)=4\times(\frac{3}{4})^4 \end{aligned}

    数学期望

  2. 设在 [0, 1] 中随机地取两个数 X,YX , Y , 求D(minX,Y)D(\min{X,Y})

    要明确minX,Y\min{X,Y}也是g(X,Y)g(X,Y)的一种形式,因此应该先求出(X,Y)(X,Y)的联合分布律,在按计算E(g(X,Y))E(g(X,Y))的方法进行计算

  3. 相互独立与不相关

    X,YX,Y相互独立,则P(X<x,Y<b)=P(X<x)P(Y<y)P(X\lt x, Y\lt b)=P(X\lt x)P(Y\lt y)

    X,YX,Y不相关,则cov(X,Y)=0cov(X,Y)=0

    在正态分布与特殊均匀分布中,独立等价于不相关

作者

OWPETER

发布于

2024-12-09

更新于

2025-01-03

许可协议

评论