复旦大学-432统计学-2025年

  1. (10分) 你和李四一起玩骰子,一共有 AA,BB, CC 三种骰子,分别为AA= “115555”, BB = “333444”, CC = “222266”, 李四先从中选,你从剩下的里面再选,请问你的策略是什么?(即李四选AA,BB,CC其中一个,你如何应对使得投出来的点数大于他的概率更大?

Solution:

情况1,李四选择骰子AA
选骰子BB: AA掷出1时,BB掷出3或4;AA掷出5时,BB不可能比他大,于是点数大于AA的概率: 13×1=13\frac{1}{3} \times 1= \frac{1}{3}
选骰子CC: AA掷出1时,CC掷出2或6;AA掷出5时,CC掷出6才比他大,于是点数大于AA的概率: 13×1+23×13=13+29=59\frac{1}{3} \times 1 + \frac{2}{3} \times \frac{1}{3} = \frac{1}{3} + \frac{2}{9} = \frac{5}{9}
情况2,李四选择骰子BB
选骰子AA:BB掷出3时,AA掷出5;BB掷出4时,AA掷出5才比他大,于是点数大于BB的概率: 12×23+12×23=23\frac{1}{2} \times \frac{2}{3} + \frac{1}{2} \times \frac{2}{3} = \frac{2}{3}
选骰子CC:BB掷出3时,CC掷出6才比他大;BB掷出4时,CC掷出6才比他大,于是点数大于BB的概率: 12×13+12×13=13\frac{1}{2} \times \frac{1}{3} + \frac{1}{2} \times \frac{1}{3} = \frac{1}{3}
情况3,李四选择骰子CC
选骰子AA: CC掷出2时,AA掷出5才比他大;CC掷出6时,AA不可能比他大,于是点数大于CC的概率: 23×23+13×0=49\frac{2}{3} \times \frac{2}{3} + \frac{1}{3} \times 0 = \frac{4}{9}
选骰子BB: CC掷出2时,BB掷出3或4才比他大;CC掷出6时,BB不可能比他大,于是点数大于CC的概率: 23×1=23\frac{2}{3} \times 1 = \frac{2}{3}
所以策略是:如果李四选择骰子AA,你选择骰子CC;如果李四选择骰子BB,你选择骰子AA; 如果李四选择骰子CC,你选择骰子BB

  1. (10分) XX, YY 服从两点分布,则它们独立的充要条件是:Cov(X,Y)=0Cov(X,Y)=0.

Solution: 见 2016 年第五题, 原题重现.

  1. (10分) 设概率空间 (Ω,F,P)(\Omega, \mathcal{F}, P) 中的 Ω\Omega 的元素个数为 nn ,是古典概型,非平凡事件 A,BA, B 独立.
    (1)证明: ABAcBc=AcBABc|A \cap B||A^c \cap B^c| = |A^c \cap B||A \cap B^c|;
    (2)证明: nn 为合数.

Solution:(1)由于 AABB 是独立的,我们有:

P(AB)=P(A)P(B)P(A \cap B) = P(A)P(B)

P(A)=An,P(B)=Bn,P(AB)=ABnP(A) = \frac{|A|}{n}, \quad P(B) = \frac{|B|}{n}, \quad P(A \cap B) = \frac{|A \cap B|}{n}

ABn=AnBnAB=ABn\frac{|A \cap B|}{n} = \frac{|A|}{n} \cdot \frac{|B|}{n} ,|A \cap B| = \frac{|A||B|}{n}

由于 AcA^cBcB^c 也是独立的:

P(AcBc)=P(Ac)P(Bc)P(A^c \cap B^c) = P(A^c)P(B^c)

P(Ac)=1P(A)=1An=nAnP(A^c) = 1 - P(A) = 1 - \frac{|A|}{n} = \frac{n - |A|}{n}

P(Bc)=1P(B)=1Bn=nBnP(B^c) = 1 - P(B) = 1 - \frac{|B|}{n} = \frac{n - |B|}{n}

P(AcBc)=nAnnBn=(nA)(nB)n2P(A^c \cap B^c) = \frac{n - |A|}{n} \cdot \frac{n - |B|}{n} = \frac{(n - |A|)(n - |B|)}{n^2}

AcBc=(nA)(nB)n|A^c \cap B^c| = \frac{(n - |A|)(n - |B|)}{n}

接下来,考虑事件 AcBA^c \cap BABcA \cap B^c

P(AcB)=P(Ac)P(B)=nAnBn=(nA)Bn2P(A^c \cap B) = P(A^c)P(B) = \frac{n - |A|}{n} \cdot \frac{|B|}{n} = \frac{(n - |A|)|B|}{n^2}

AcB=(nA)Bn|A^c \cap B| = \frac{(n - |A|)|B|}{n}

P(ABc)=P(A)P(Bc)=AnnBn=A(nB)n2P(A \cap B^c) = P(A)P(B^c) = \frac{|A|}{n} \cdot \frac{n - |B|}{n} = \frac{|A|(n - |B|)}{n^2}

ABc=A(nB)n|A \cap B^c| = \frac{|A|(n - |B|)}{n}

ABAcBc=(ABn)((nA)(nB)n)=AB(nA)(nB)n2|A \cap B||A^c \cap B^c| = \left(\frac{|A||B|}{n}\right)\left(\frac{(n - |A|)(n - |B|)}{n}\right) = \frac{|A||B|(n - |A|)(n - |B|)}{n^2}

AcBABc=((nA)Bn)(A(nB)n)=AB(nA)(nB)n2|A^c \cap B||A \cap B^c| = \left(\frac{(n - |A|)|B|}{n}\right)\left(\frac{|A|(n - |B|)}{n}\right) = \frac{|A||B|(n - |A|)(n - |B|)}{n^2}

因此:ABAcBc=AcBABc|A \cap B||A^c \cap B^c| = |A^c \cap B||A \cap B^c|
(2)假设 nn 是一个质数。那么 nn 的唯一正因数是 1 和 nn 本身。由于 AABB 是非平凡事件,它们的个数 A|A|B|B| 必须在 1 和 n1n-1 之间。因此, A|A|B|B| 都不是 nn 的因数。
从第一部分的等式 ABAcBc=AcBABc|A \cap B||A^c \cap B^c| = |A^c \cap B||A \cap B^c| ,我们知道:

ABn(nA)(nB)n=(nA)BnA(nB)n\frac{|A||B|}{n} \cdot \frac{(n - |A|)(n - |B|)}{n} = \frac{(n - |A|)|B|}{n} \cdot \frac{|A|(n - |B|)}{n}

这个等式成立,但如果我们假设 nn 是质数,那么 A|A|B|B| 都不能整除 nn ,这将导致等式两边的分子不能被 n2n^2 整除,从而导致矛盾。因此nn 不能是质数,它必须是合数。

  1. (10分) 若 P(Xx,Yy)=F(min(x,y))P(X \leq x, Y \leq y) = F(\min(x, y)),证明:P(X=Y=1P(X = Y)= 1.

Solution: 《应坚刚》第六章划题. 对任意 xRx \in \mathbb{R} ,有 :

P(X \leq x < Y) = P(X \leq x,Y < \infty) - P(X \leq x, Y \leq x) = 0, $$ 因此容易说明 $\{X < Y\} = \bigcup_{x \in \mathbb{Q}} \{X \leq x < Y\}$ 是零测集,同理 $\{X > Y\}$ 是零测集,结论成立。 </font> 5. (15分) $X$, $Y$独立同分布于$F$,二阶矩存在,证明: (1) $E|X-Y|^2 = 2Var(X)$ (2) $Var(\sin x) \leq Var(x)$ <font color=#6495ED> Solution:(1)由于 $X$ 和 $Y$ 独立同分布于 $F$ ,我们有:

E(X) = E(Y), Var(X) = Var(Y)

E((X-Y)^2) = E(X^2 - 2XY + Y^2) = E(X^2) - 2E(XY) + E(Y^2)

由于 $X$和 $Y$独立,我们有 $E(XY) = E(X)E(Y)$ 。因此:

\begin{align*}
E((X - Y)^2) &= E(X^2) - 2E(X)E(Y) + E(Y^2) \
&= E(X^2) - 2E(X)^2 + E(X^2) \
&= 2E(X^2) - 2E(X)^2 \
&= 2(E(X^2) - E(X)^2) \
\end{align*}

根据方差的定义, $Var(X) = E(X^2) - E(X)^2$ ,因此:

E((X-Y)^2) = 2Var(X)

(2)庞加莱不等式证法重现. 对任意 $x_0$, 有 :

\begin{aligned}
Var\left( f\left( X \right) \right) &\le E\left[ \left( f\left( X \right) -f\left( x_0 \right) \right) ^2 \right] =E\left[ \left( \int_{x_0}^X{f’\left( t \right) \mathrm{d}t} \right) ^2 \right]\
&\le E\left[ \left( \int_{x_0}^X{\left( f’\left( t \right) \right) ^2\mathrm{d}t} \right) \left( \int_{x_0}X{12\mathrm{d}t} \right) \right] =E\left[ \left( X-x_0 \right) \left( \int_{x_0}^X{\left( f’\left( t \right) \right) ^2\mathrm{d}t} \right) \right]\
&\le \mathop {\mathrm{sup}} \limits_{t}\left| \left( f’\left( t \right) \right) ^2 \right|\cdot E\left[ \left( X-x_0 \right) ^2 \right] .\
\end{aligned}$$ 这里 f(t)2=(cost)21f'(t)^2 =(\cos t )^2 \le 1, 再选 x0=E(X)x_0 = E(X), 得证.(也可直接根据第一问的结论证明)

  1. (10分) X1,X2X_1, X_2 独立同分布于 U(0,1)U(0,1) , 记 Y1=min(X1,X2),Y2=max(X1,X2)Y_1 = \min(X_1, X_2), Y_2 = \max(X_1, X_2) , 计算 E[X1Y2]E[X_1|Y_2].

Solution: 由于 Y2Be(2,1)\quad Y_2 \sim Be(2,1), E(X1)=12E(X_1) = \frac{1}{2}, E(Y2)=23E(Y_2) = \frac{2}{3},

E(X1Y2)=E[E(X1Y2Y2)]=E[Y2E(X1Y2)]E(X_1Y_2) = E[E(X_1Y_2 \mid Y_2)] = E[Y_2 E(X_1 \mid Y_2)]

并且:

Y1+Y2=X1+X2Y_1+ Y_2 = X_1 +X_2

E(X1Y2)=12E(X1+X2Y2)E(X_1 \mid Y_2) = \frac{1}{2} E(X_1+X_2 \mid Y_2)

对于 0y1y210 \leq y_1 \leq y_2 \leq 1

fY1,Y2(y1,y2)=2f_{Y_1, Y_2}(y_1, y_2) = 2

fY2(y2)=0y2fY1,Y2(y1,y2)dy1=0y22dy1=2y2f_{Y_2}(y_2) = \int_0^{y_2} f_{Y_1, Y_2}(y_1, y_2) \, dy_1 = \int_0^{y_2} 2 \, dy_1 = 2y_2

fY1Y2(y1y2)=fY1,Y2(y1,y2)fY2(y2)=22y2=1y2f_{Y_1|Y_2}(y_1|y_2) = \frac{f_{Y_1, Y_2}(y_1, y_2)}{f_{Y_2}(y_2)} = \frac{2}{2y_2} = \frac{1}{y_2}

\begin{align*} E(Y_1|Y_2=y_2) &= \int_0^{y_2} y_1 f_{Y_1|Y_2}(y_1|y_2) \, dy_1 = \int_0^{y_2} y_1 \frac{1}{y_2} \, dy_1 \\& = \frac{1}{y_2} \int_0^{y_2} y_1 \, dy_1 = \frac{1}{y_2} \left[ \frac{y_1^2}{2} \right]_0^{y_2} \\&= \frac{1}{y_2} \cdot \frac{y_2^2}{2}= \frac{y_2}{2}\end{align*}

E(X1Y2)=12E(X1+X2Y2)=12E(Y1+Y2Y2)=12Y2+12E(Y1Y2)=Y22+12Y22=3Y24.E(X_1 \mid Y_2) = \frac{1}{2} E(X_1+X_2 \mid Y_2) = \frac{1}{2} E(Y_1+ Y_2 \mid Y_2) = \frac{1}{2} Y_2 + \frac{1}{2} E( Y_1 \mid Y_2) = \frac{Y_2}{2} + \frac{1}{2} \cdot \frac{Y_2}{2} = \frac{3Y_2}{4}.

7.(15分) 给定二元函数

f(x,y)=c(ex2+y22+xy(x2y2)eID(x,y))f(x,y)=c\left(e^{-\frac{x^2+y^2}{2}}+\frac{xy(x^2-y^2)}{\sqrt{e}}I_{D}(x,y)\right)

其中 D={(x,y)x2+y21}D=\{(x,y) \mid x^2+y^2 \leq 1\}cc >0。

(1) 证明: f(x,y)>0f(x,y) > 0

(2) 设 (X,Y)(X,Y) 的联合密度为 f(x,y)f(x,y) ,求 cc

(3) 求 X,YX,Y 的边缘分布,求 Cov(X,Y)\text{Cov}(X,Y)XXYY 是否独立?

Solution: (1) (x,y)D(x,y) \notin D 时显然大于0,(x,y)D(x,y) \in D 时,令 x=ρcosθx = \rho\cos\thetay=ρsinθy = \rho\sin\theta

f(x,y)=c(eρ22+ρ2sinθcosθ(cos2θsin2θ)e)>(112ρ2+ρ2sin4θ4e)>c(11214e)>0\begin{aligned} f(x,y) &= c\left(e^{-\frac{\rho^2}{2}} + \frac{\rho^2 \cdot \sin \theta \cos \theta (\cos^2 \theta - \sin^2 \theta)}{\sqrt{e}}\right)\\ &> \left(1 - \frac{1}{2} \rho^2 + \frac{\rho^2 \cdot \sin 4\theta}{4\sqrt{e}}\right) \\ &> c \cdot \left(1 - \frac{1}{2} - \frac{1}{4\sqrt{e}}\right) \\ &>0 \end{aligned}

(2) 由正则性

f(x,y)dxdy=1.\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} f(x,y) \, dx \, dy = 1.

我们将积分分为两部分: (x,y)D(x,y) \in D(x,y)D(x,y) \notin D
对于 (x,y)D(x,y) \notin D

cex2+y22dxdyDcex2+y22dxdy.\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} c e^{-\frac{x^2+y^2}{2}} \, dx \, dy - \int_{D} c e^{-\frac{x^2+y^2}{2}} \, dx \, dy.

对于 (x,y)D(x,y) \in D

Dc(ex2+y22+xy(x2y2)e)dxdy.\int_{D} c \left( e^{-\frac{x^2+y^2}{2}} + \frac{xy(x^2-y^2)}{\sqrt{e}} \right) \, dx \, dy.

将这两部分合并,我们得到,

cex2+y22dxdy=1.c \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} e^{-\frac{x^2+y^2}{2}} \, dx \, dy = 1.

x=rcosθx = r\cos\thetay=rsinθy = r\sin\theta ,则 x2+y2=r2x^{2}+y^{2}=r^{2}
r0,0θ2πr \geq 0,0 \leq \theta \leq 2\pi

ex2+y22dxdy=02π0er22rdrdθ\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} e^{-\frac{x^2+y^2}{2}} \, dx \, dy= \int_{0}^{2\pi}\int_{0}^{\infty} e^{-\frac{r^{2}}{2}}r drd\theta

u=r2u = r^{2}du=2rdrdu = 2r dr

02πdθ0er22rdr=02πdθ012eu2du=02πdθ[eu2]0=02πdθ=2π\int_{0}^{2\pi}d\theta\int_{0}^{\infty} e^{-\frac{r^{2}}{2}}r dr = \int_{0}^{2\pi}d\theta\int_{0}^{\infty}\frac{1}{2}e^{-\frac{u}{2}}du=\int_{0}^{2\pi}d\theta\left[- e^{-\frac{u}{2}}\right]_{0}^{\infty} = \int_{0}^{2\pi}d\theta= 2\pi

(也可直接根据二元正态分布的联合密度函数得出), 于是:

c=12πc = \frac{1}{2\pi}

(3) 首先,我们求 XX 的边缘分布。由于 f(x,y)f(x,y) 关于 yy 对称,所以 XX 的边缘分布为

fX(x)=f(x,y)dy=12π(ex2+y22+xy(x2y2)e1D(x,y))dy.f_X(x) = \int_{-\infty}^{\infty} f(x,y) \, dy = \int_{-\infty}^{\infty} \frac{1}{2\pi} \left( e^{-\frac{x^2+y^2}{2}} + \frac{xy(x^2-y^2)}{\sqrt{e}} 1_{D}(x,y) \right) \, dy.

由于 xy(x2y2)e1D(x,y)\frac{xy(x^2-y^2)}{\sqrt{e}} 1_{D}(x,y) 关于 yy 是奇函数,所以

xy(x2y2)e1D(x,y)dy=0.\int_{-\infty}^{\infty} \frac{xy(x^2-y^2)}{\sqrt{e}} 1_{D}(x,y) \, dy = 0.

因此:

fX(x)=12πex2+y22dy=12πex22.f_X(x) = \frac{1}{2\pi} \int_{-\infty}^{\infty} e^{-\frac{x^2+y^2}{2}} \, dy = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}.

同理, yy 的边缘分布为:

fY(y)=12πey22.f_Y(y) = \frac{1}{\sqrt{2\pi}} e^{-\frac{y^2}{2}}.

由于: fY(y)fX(x)f(x,y)f_Y(y)f_X(x)≠ f(x,y),所以X,Y不独立。

E(XY)=xyf(x,y)dxdy=xy12π(ex2+y22+xy(x2y2)e1D(x,y))dxdy.E(XY) = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} xy f(x,y) \, dx \, dy = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} xy \frac{1}{2\pi} \left( e^{-\frac{x^2+y^2}{2}} + \frac{xy(x^2-y^2)}{\sqrt{e}} 1_{D}(x,y) \right) \, dx \, dy.

由于 ex2+y22e^{-\frac{x^2+y^2}{2}} 关于 xxyy 都是对称的,所以

xyex2+y22dxdy=0.\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} xy e^{-\frac{x^2+y^2}{2}} \, dx \, dy = 0.

令:x=rcosθx=r\cos\thetay=rsinθy=r\sin\theta ,积分变为:

02π01(rcosθ)(rsinθ)(r2cos2θr2sin2θ)erdrdθ.\int_{0}^{2\pi}\int_{0}^{1}\frac{(r\cos\theta)(r\sin\theta)(r^2\cos^2\theta-r^2\sin^2\theta)}{\sqrt{e}}r\,dr\,d\theta.

简化被积函数,我们得到:

02π01r5cosθsinθ(cos2θsin2θ)edrdθ.\int_{0}^{2\pi}\int_{0}^{1}\frac{r^5\cos\theta\sin\theta(\cos^2\theta-\sin^2\theta)}{\sqrt{e}}\,dr\,d\theta.

注意到 cosθsinθ(cos2θsin2θ)\cos\theta\sin\theta(\cos^2\theta-\sin^2\theta) 是一个奇函数,因此:

02πcosθsinθ(cos2θsin2θ)dθ=0.\int_{0}^{2\pi}\cos\theta\sin\theta(\cos^2\theta-\sin^2\theta)\,d\theta=0.

所以: Cov(X,Y)=E(XY)E(X)E(Y)=0Cov(X,Y)=E(XY) -E(X)E(Y)=0

  1. (10分) 打怪物会爆装备1和2,爆出装备1的概率是0.2 ,爆出装备2的概率是 0.2,不获得任何装备的概率是0.6,设 τ\tau 是集齐装备所用的次数,求 EτE\tauVarτVar\tau.

Solution: 令:ξ1\xi_1 表示收集到第一件装备所需的次数,其成功概率为 0.4(因为获得装备1或装备2的概率为 0.2 + 0.2 = 0.4)。ξ2\xi_2 表示在收集到第一件装备后,收集到第二件装备所需的次数,其成功概率为 0.2(因为获得第2个装备的概率为 0.2)。
对于几何分布随机变量 ξGe(p)\xi \sim Ge(p) ,其期望 Eξ=1pE\xi = \frac{1}{p} 。因此:Eξ1=10.4=2.5E\xi_1 = \frac{1}{0.4} = 2.5Eξ2=10.2=5E\xi_2 = \frac{1}{0.2} = 5

Eτ=Eξ1+Eξ2=2.5+5=7.5E\tau = E\xi_1 + E\xi_2 = 2.5 + 5 = 7.5

对于几何分布随机变量 ξGe(p)\xi \sim Ge(p) ,其方差 Varξ=1pp2Var\xi = \frac{1-p}{p^2} 。因此:

Varξ1=10.40.42=0.60.16=3.75Varξ2=10.20.22=0.80.04=20Varτ=Varξ1+Varξ2=3.75+20=23.75\begin{aligned} Var\xi_1 &= \frac{1-0.4}{0.4^2} = \frac{0.6}{0.16} = 3.75\\ Var\xi_2 &= \frac{1-0.2}{0.2^2} = \frac{0.8}{0.04} = 20\\ Var\tau &= Var\xi_1 + Var\xi_2 = 3.75 + 20 = 23.75 \end{aligned}

因此,收集到两件装备所需的期望次数为 7.5 次,方差为 23.75。

  1. (15分) 设 X1,,XnX_1, \cdots, X_n 独立同分布于连续函数 FF, 样本 Yi=μ+σ[lnF(Xi)]12Y_i = \mu + \sigma[-\ln F(X_i)]^{-\frac{1}{2}} ,μ>0,σ>0\mu>0,\sigma>0

(1) 求 (μ,σ)(\mu,\sigma) 的最大似然估计。

(2) 若 μ\mu 已知,求 σ2\sigma^2 的充分统计量。

Solution: (1) 令 Zi=F(Xi)Z_i = F(X_i),则 ZiU(0,1)Z_i \sim U(0,1)

Yi=μ+σ[lnZi]12Y_i = \mu + \sigma \left[ -\ln Z_i \right]^{-\frac{1}{2}}

由于 ZiU(0,1)Z_i \sim U(0,1)lnZi-\ln Z_i 服从参数为 1 的指数分布,即 lnZiExp(1)-\ln Z_i \sim \text{Exp}(1)
Wi=[lnZi]12W_i = \left[ -\ln Z_i \right]^{-\frac{1}{2}}

P(wiw)=P((lnzi)12w)=P(ziew2)=ew2P(w_i \leq w) = P\left( \left( -\ln z_i \right)^{-\frac{1}{2}} \leq w \right) = P\left( z_i \leq e^{-w^{-2}} \right) = e^{-w^{-2}}

fwi(w)=2w3ew2,yi=μ+σwif_{w_i}(w) = 2w^{-3} e^{-w^{-2}}, \quad y_i = \mu + \sigma \cdot w_i

fYi(yi)=fwi(yiμσ)1σ=2σ2(yiμ)3e(σyiμ)2f_{Y_i}(y_i) = f_{w_i}\left( \frac{y_i - \mu}{\sigma} \right) \cdot \frac{1}{\sigma} = 2\sigma^2 \cdot (y_i - \mu)^{-3} \cdot e^{-\left( \frac{\sigma}{y_i - \mu} \right)^2}

f(y1,,yn)=i=1n2σ2(yiμ)3e(σyiμ)2f(y_1, \cdots, y_n) = \prod_{i = 1}^{n} 2\sigma^2 (y_i - \mu)^{-3} e^{-\left( \frac{\sigma}{y_i - \mu} \right)^2}

lnf=i=1n[3ln(yiμ)(σyiμ)2]+2nlnσ+nln2\ln f = \sum_{i = 1}^{n} \left[ -3\ln(y_i - \mu) - \left( \frac{\sigma}{y_i - \mu} \right)^2 \right] + 2n\ln\sigma + n\ln 2

μ\mu 的偏导数为:

lnfμ=i=1n[3yiμ2σ2(yiμ)3]=0\frac{\partial \ln f}{\partial \mu} = \sum_{i = 1}^{n} \left[ \frac{3}{y_i - \mu} - \frac{2\sigma^2}{(y_i - \mu)^3} \right] = 0

i=1n3(yiμ)22σ2(yiμ)3=0(1)\Rightarrow \sum_{i = 1}^{n} \frac{3(y_i - \mu)^2 - 2\sigma^2}{(y_i - \mu)^3} = 0 \quad (1)

σ\sigma 的偏导数为:

lnfσ=i=1n2σ(yiμ)2+2nσ=0\frac{\partial \ln f}{\partial \sigma} = \sum_{i = 1}^{n} \frac{-2\sigma}{(y_i - \mu)^2} + \frac{2n}{\sigma} = 0

i=1n1(yiμ)2=nσ2(2)\Rightarrow \sum_{i = 1}^{n} \frac{1}{(y_i - \mu)^2} = \frac{n}{\sigma^2} \quad (2)

S1(μ)=i=1n1yiμS_1(\mu) = \sum_{i = 1}^{n} \frac{1}{y_{i} - \mu}
S2(μ)=i=1n1(yiμ)2S_2(\mu) = \sum_{i = 1}^{n} \frac{1}{(y_{i} - \mu)^{2}}
S3(μ)=i=1n1(yiμ)3S_3(\mu) = \sum_{i = 1}^{n} \frac{1}{(y_{i} - \mu)^{3}},则:

3S1(μ)2σ2S3(μ)=0,S2(μ)nσ2=03S_1(\mu) - 2\sigma^2 S_3(\mu) = 0, \quad S_2(\mu) - \frac{n}{\sigma^2} = 0

(\mu, \sigma) 的极大似然估计即为满足上式的值。
(由于 lnf\ln f 关于 μ,σ\mu, \sigma 并不单调,所以不能直接取 μ=y(1)\mu = y_{(1)})

(2) 根据因子分解定理,如果似然函数可以写成 L(σ2)=g(T(Y),σ2)h(Y)L(\sigma^2) = g(T(Y), \sigma^2) h(Y) 的形式,其中 T(Y)T(Y) 是样本的函数,gghh 是两个函数,那么 T(Y)T(Y)σ2\sigma^2 的充分统计量。似然函数为:

L(σ2)=i=1n2(yiμ)3exp{i=1n[(σyiμ)2]+2nln(σ)}L(\sigma^2) = \prod_{i=1}^n 2(y_i - \mu)^{-3} \exp \left\{ \sum_{i=1}^n \left[ - \left( \frac{\sigma}{y_i - \mu} \right)^2 \right] + 2n \ln(\sigma) \right\}

这里, T(Y)=i=1n1(yiμ)2T(Y) = \sum_{i=1}^n \frac{1}{(y_i - \mu)^2}σ2\sigma^2 的充分统计量。

  1. (15分)设总体为对数正态分布 LN(μ,σ2)LN(\mu, \sigma^2) ,简单样本为 X1,,XnX_1, \cdots, X_n.

(1) 求 μ\mu 的矩估计、最大似然估计。

(2) 求 θ=eμ+12\theta = e^{\mu + \frac{1}{2}} 的最大似然估计,并分析其是否无偏。

Solution: (1) 对于对数正态分布 LN(μ,σ2)LN(\mu, \sigma^2) ,其均值 E(X)=eμ+σ22E(X) = e^{\mu + \frac{\sigma^2}{2}} 。样本均值 Xˉ\bar{X} 可作为 E(X)E(X) 的估计,因此:

Xˉ=eμ+σ22\bar{X} = e^{\mu + \frac{\sigma^2}{2}}

解出 μ\mu 得到矩估计:

μ1^=ln(Xˉ)σ22\hat{\mu1} = \ln(\bar{X}) - \frac{\sigma^2}{2}

L(μ,σ)=i=1n1Xiσ2πe(lnXiμ)22σ2L(\mu, \sigma) = \prod_{i=1}^n \frac{1}{X_i \sigma \sqrt{2\pi}} e^{-\frac{(\ln X_i - \mu)^2}{2\sigma^2}}

lnL(μ,σ)=nln(σ)n2ln(2π)i=1n(lnXiμ)22σ2i=1nlnXi\ln L(\mu, \sigma) = -n\ln(\sigma) - \frac{n}{2}\ln(2\pi) - \sum_{i=1}^n \frac{(\ln X_i - \mu)^2}{2\sigma^2} - \sum_{i=1}^n \ln X_i

μ\mu 求偏导数:

lnLμ=i=1nlnXiμσ2=0μ^MLE=1ni=1nlnXi\begin{aligned} \frac{\partial \ln L}{\partial \mu} &= \sum_{i=1}^n \frac{\ln X_i - \mu}{\sigma^2} = 0 \\ \hat{\mu}_{\text{MLE}} &= \frac{1}{n} \sum_{i=1}^n \ln X_i \end{aligned}

(2) 由极大似然估计的不变性:若 (μ^,σ^)(\hat{\mu}, \hat{\sigma})(μ,σ)(\mu, \sigma) 的极大似然估计,则对于任何函数 T(μ,σ)T(\mu, \sigma)TT 的极大似然估计为
T(μ^,σ^)T(\hat{\mu}, \hat{\sigma}) 。因此, θ\theta 的最大似然估计为:θ^MLE=eμ^+12\hat{\theta}_{\text{MLE}} = e^{\hat{\mu} + \frac{1}{2}},由于μ^MLE\hat{\mu}_{\text{MLE}}μ\mu 的无偏估计,我们有:E(μ^MLE)=μE(\hat{\mu}_{\text{MLE}}) = \mu。$$E(e{\mu})>e{E(\mu)}=e^{\mu}$$所以θ\theta不是无偏估计。

  1. (15分) 设随机变量 XX 的概率密度函数为:

f(x;θ)={θxθ1,0<x<1,0,其他f(x; \theta) = \begin{cases} \theta x^{\theta -1}, & 0 < x < 1, \\ 0, & \text{其他} \end{cases}

X1,X2X_1, X_2 来自该总体的样本,考虑假设检验问题:

H0:θ=1H1:θ=2,H_0: \theta = 1 \leftrightarrow H_1: \theta = 2,

其否定域为 W={(X1,X2)X1X2>34}W = \{(X_1, X_2) \mid X_1 X_2 > \frac{3}{4}\} ,求第一、二类错误的概率.

Solution: 1.第一类错误:弃真。即在 θ=1\theta = 1 的情况下, X1X2>34X_1 X_2 > \frac{3}{4} 的概率。
θ=1\theta = 1 时, XX 的概率密度函数为 f(x;1)=1f(x; 1) = 10<x<10 < x < 1 。因此, X1X_1X2X_2 都是 (0,1)(0, 1) 上的均匀分布, 34x1<1\frac{3}{4x_1}<1, 求出x1>34x_1> \frac{3}{4}

P(X1X2>34θ=1)=34134x111dx2dx1=14+3ln343ln22P(X_1 X_2 > \frac{3}{4}, \theta = 1) = \int_{\frac{3}{4}}^1 \int_{\frac{3}{4x_1}}^1 1 \, dx_2 \, dx_1 =\frac{1}{4}+\frac{3 \ln 3}{4}-\frac{3\ln 2}{2}

因此,第一类错误的概率为:

α=14+3ln343ln22\alpha =\frac{1}{4}+\frac{3 \ln 3}{4}-\frac{3\ln 2}{2}

2.第二类错误:取伪,即在 H1H_1 为真时接受 H0H_0 的概率。即在 θ=2\theta = 2 的情况下, X1X234X_1 X_2 \leq \frac{3}{4} 的概率。当 x1<34x_1 < \frac{3}{4} 时, x2x_2 的积分范围是 (0,1)(0, 1),而当 x134x_1 \geq \frac{3}{4} 时, x2x_2 的积分范围是 (0,34x1)(0, \frac{3}{4x_1}) 。因此:

P(X1X234θ=2)=0342x1dx1+34198x1dx1=916+9ln249ln38P(X_1 X_2 \leq \frac{3}{4}, \theta = 2) = \int_0^{\frac{3}{4}} 2x_1 \, dx_1 + \int_{\frac{3}{4}}^1 \frac{9}{8x_1} \, dx_1=\frac{9}{16}+\frac{9\ln2}{4}-\frac{9\ln3}{8}

因此,第二类错误的概率为:

β=916+9ln249ln38\beta =\frac{9}{16}+\frac{9\ln2}{4}-\frac{9\ln3}{8}

  1. (15分) 设总体 XX 满足 P(X>xθ)=e(θx)kP(X > x | \theta) = e^{-(\theta x)^k} ,参数 θ\theta 的先验分布满足 θkΓ(α,β)\theta^k\sim \Gamma(\alpha, \beta) ,这里 α=2\alpha = 2 , β=1\beta = 1 , k=2k = 2 ,给定样本 x1,,xnx_1, \ldots, x_n ,求 θ\theta 的后验分布.

Solution: 由于 P(X>xθ)=e(θx)2P(X > x | \theta) = e^{-(\theta x)^2},我们可以得到 P(Xxθ)=1e(θx)2P(X \leq x | \theta) = 1 - e^{-(\theta x)^2}

f(xiθ)=ddxiP(Xxiθ)=2θ2xie(θxi)2f(x_i | \theta) = \frac{d}{dx_i} P(X \leq x_i | \theta) = 2 \theta^2 x_i e^{-(\theta x_i)^2}

因此:

L(x1,,xnθ)=i=1n2θ2xie(θxi)2=2nθ2n(i=1nxi)ei=1n(θxi)2L(x_1, \ldots, x_n | \theta) = \prod_{i=1}^{n} 2 \theta^2 x_i e^{-(\theta x_i)^2} = 2^n \theta^{2n} \left( \prod_{i=1}^{n} x_i \right) e^{-\sum_{i=1}^{n} (\theta x_i)^2}

参数 θ2\theta^2 的先验分布为:

θ2Γ(2,1)\theta^2 \sim \Gamma(2, 1)

g(θ2)=12Γ(2)(θ2)21e1θ2=θ2eθ2g(\theta^2) = \frac{1^2}{\Gamma(2)} (\theta^2)^{2-1} e^{-1 \cdot \theta^2} = \theta^2 e^{-\theta^2}

根据贝叶斯定理,后验分布 π(θ2x1,,xn)\pi(\theta^2 | x_1, \ldots, x_n) 与似然函数和先验分布的乘积成正比:

π(θ2x1,,xn)L(θx1,,xn)g(θ2)\pi(\theta^2 | x_1, \ldots, x_n) \propto L(\theta | x_1, \ldots, x_n) \cdot g(\theta^2)

代入似然函数和先验分布,得到:

π(θ2x1,,xn)2nθ2n(i=1nxi)ei=1n(θxi)2θ2eθ2\pi(\theta^2 | x_1, \ldots, x_n) \propto 2^n \theta^{2n} \left( \prod_{i=1}^{n} x_i \right) e^{-\sum_{i=1}^{n} (\theta x_i)^2} \cdot \theta^2 e^{-\theta^2}

π(θ2x1,,xn)θ2n+2eθ2(i=1nxi2+1)\pi(\theta^2 | x_1, \ldots, x_n) \propto \theta^{2n+2} e^{-\theta^2 \left( \sum_{i=1}^{n} x_i^2 + 1 \right)}

说明 θ2\theta^2 后验分布依旧还是伽马分布,参数 θ2\theta^2 的后验分布为:

θ2x1,,xnΓ(n+2,i=1nxi2+1)\theta^2 | x_1, \ldots, x_n \sim \Gamma(n+2, \sum_{i=1}^{n} x_i^2 + 1)

于是:

f(θ2x1,,xn)=θ2(n+1)Γ(n+2)(i=1nxi2+1)n+2e(i=1nxi2+1)θ2f(\theta^2 | x_1, \ldots, x_n) = \frac{\theta^{2(n+1)}}{\Gamma(n+2)} (\sum_{i=1}^{n} x_i^2 + 1)^{n+2} e^{-(\sum_{i=1}^{n} x_i^2 + 1) \theta^2}

f(θx1,,xn)={f(θ2x1,,xn)θ=θ2n+3Γ(n+2)(i=1nxi2+1)n+2e(i=1nxi2+1)θ2,θ>0f(θ2x1,,xn)θ=θ2n+3Γ(n+2)(i=1nxi2+1)n+2e(i=1nxi2+1)θ2,θ<0f(\theta | x_1, \ldots, x_n) = \left\{ \begin{array}{ll} f(\theta^2 | x_1, \ldots, x_n) \theta = \frac{\theta^{2n+3}}{\Gamma(n+2)} (\sum_{i=1}^{n} x_i^2 + 1)^{n+2} e^{-(\sum_{i=1}^{n} x_i^2 + 1) \theta^2}, & \theta > 0 \\ -f(\theta^2 | x_1, \ldots, x_n) \theta = - \frac{\theta^{2n+3}}{\Gamma(n+2)} (\sum_{i=1}^{n} x_i^2 + 1)^{n+2} e^{-(\sum_{i=1}^{n} x_i^2 + 1) \theta^2}, & \theta < 0 \end{array} \right.