北京师范大学-432统计学-2025年
-
从区间取个样本,给定组数。 (20分)
(1)介绍绘制频率直方图的步骤.
(2)为样本密度函数,任给是的估计值,求的均方误差.
Solution:
(1)1.确定组数和组距:组数: ,组距: 。
2.计算频数:对于每个组,统计落在该组内的样本数量,即为该组的频数。
3.计算频率:将每个组的频数除以总样本数 ,得到该组的频率。
4.绘制直方图:在坐标系中,横轴表示样本值,纵轴表示频率。对于每个组,绘制一个矩形,其宽度为组距,高度为该组的频率。这些矩形相邻排列,形成直方图。
(2)均方误差是
在直方图估计中,我们通常假设每个组内的样本是独立同分布的,并且每个样本落入某个特定组的概率是 ,其中 是组距。在每个组内,样本数 ,方差是 。
由于:
由于为的无偏估计,所以:
- 个球一共有种颜色,第种颜色球的个数为,有放回摸球次 (30分)
(1)求摸到每种颜色球个数的协方差矩阵.
(2)为摸到第一种颜色球的个数,表示在n次摸球中摸到第一种颜色球的个数,证明:
(3) 证明:
Solution:
(1) 定义随机变量 为摸到第 种颜色球的个数,其中 。由于每次摸球是独立的,并且有放回,所以 服从二项分布 ,其中 是摸到第 种颜色球的概率。
对于 和 ( ),它们的协方差为:
由于每次摸球只能摸到一个球,所以 。因此, 和 是负相关的。
由于 和 是负相关的,所以:
给定 ,摸到第 种颜色球的概率变为 ,所以:
简化后得到:
所以:
因此,协方差矩阵 为:
(2) 设表示摸到第一种颜色球的概率。
我们知道, ,因此:
将这个性质代入上式,得到:
(3) 令:
下面验证当 和 时, 和 是否相等。
由于 并且 和 在边界条件 和 下相等,得出结论 对所有 成立。
-
在 ,区间内取样本: (20分)
(1)求的矩估计和极大似然估计.
(2)证明是的无偏估计.
Solution:
(1) 来自均匀分布 , 期望为: 。样本均值 是总体均值的矩估计:
和 都成立时似然函数最大,即 。因此,极大似然估计为:
(2)令:
则
其中, 所以对于均匀分布 ,最小值 和最大值 的期望值分别为:
所以 是 的无偏估计。
-
服从正态分布 (20分)$$H_0:\mu={\mu}_0,\quad H_1:\mu>{\mu}_0$$ (1)介绍假设检验原理.
(2) 分别求在已知和未知下的值表达式和其分布.
Solution:
(1) 假设检验是统计学中的一种方法,用于判断一个假设是否成立, 假设检验的步骤如下:
1.提出假设: 。
2.选择检验统计量:根据数据的类型和分布选择合适的检验统计量,当已知的时候可以用单样本的检验,当未知时用检验。
3.确定显著性水平:选择一个显著性水平 ,通常为 0.05 或 0.01。
4.计算检验统计量的值:根据样本数据计算检验统计量的值。当已知时统计量为,当未知时统计量为:
5.根据拒绝域做出决策:当已知时拒绝域为,当未知时拒绝域为:。如果统计量落在拒绝域中 ,则拒绝零假设 ,接受备择假设 ;否则,不拒绝零假设。
(2)(i) 在 已知时, 我们会选择检验统计量 , 当 较大时, 或 比 大很多时, 我们会拒绝原假设, -值的含义是当原假设成立时发生比当前样本还要极端的可能性, 它显然是样本的函数. 如果已收集到样本 , 对应有统计量 , 那么 -值是:
此时, 如果 是已知样本, 那么 也是已知量, 如果考虑样本是随机变量 , 那 也是随机变量, 即:
其中由于 , 因此 是分布函数作用在自身, , 而 仍然服从 , 因此:
(ii) 在 未知时, 我们会选择检验统计量 , 当 较大时, 或 比 大很多时, 我们会拒绝原假设, 如果已收集到样本 , 对应有统计量 , 那么 -值是:
其中 是 的分布函数. 此时, 如果 是已知样本, 那么 也是已知量, 如果考虑样本是随机变量 , 那 也是随机变量, 即:
其中由于 , 因此 是分布函数作用在自身, , 而 仍然服从 , 因此仍然有:
-
二元线性回归模型,。(30分)
(1)求的极大似然估计,数学期望,方差.
(2)如果 写成 的一元回归模型,求最小二乘估计,判断其是否是无偏估计,并比较两种情况下的方差.
Solution:
(1)
即:
整理方程(1)(2) 得到: , 同理由方程(1)(3) 得到: ,于是:
根据克拉默法则解得:
代入 得到 的值。
(克拉默法则是一种通过行列式求解线性方程组的方法。对于线性方程组:
其解为:
其中 是系数矩阵的行列式, 和 分别是通过将 的第一列和第二列替换为常数项 得到的行列式。)
(2) 此时:
将 代入方程,得到:
故其是无偏估计。
-
白噪声: , (30分)
(1)化简模型.
(2)化简模型是否宽平稳?求其自相关系数。
Solution:
(1) 该模型是 ARMA(1,2) 模型, 其简化形式是
其中 是滞后算子. 我们也可以定义滞后多项式
此时模型可写作 .
(2) (i) ARMA 模型的宽平稳条件是其 AR 部分是宽平稳的, 即 的根都在单位圆外, 此处其特征根 显然在单位圆外, 因此模型宽平稳.
(ii) 为求其自相关系数, 我们需求解其传递形式 , 其中 是 Green 函数, 且 . 我们可以递推求解, 假设 我们需求解其传递形式 , 其中 是 Green 函数, 且 . 我们可以递推求解, 假设:
又根据 , 我们有:
将左侧对应打开有:
这说明:
我们解得:
因此模型恰化为有限阶 , 这一点也可以说明模型平稳,我们紧接着计算其自协方差函数 , 显然只有 , 非零:
因此结论是: