内容简介 - press.ustc.edu.cnpress.ustc.edu.cn/sites/default/files/fujian/field... ·...
Transcript of 内容简介 - press.ustc.edu.cnpress.ustc.edu.cn/sites/default/files/fujian/field... ·...
书书书
内 容 简 介
本书介绍了工科研究生!数理统计"课程的基本内容#包括$预备知识%抽样分析%
参数估计%假设检验%方差分析%正交实验设计%回归分析和多元统计分析初步等#同时
还介绍了!"!
及其在统计分析中的应用&本书各章末均配有适量习题#书末附有部分
习题参考答案&
本书可作为工科各专业研究生的教学用书#也可作为具有一定数学基础的读者的
自学用书&
!
图书在版编目!
!"#
"数据
!
数理统计'凌能祥#李声闻#宁荣健编#
(合肥$中国科学技术大学出版社#
$%&'#(
!
)!*+(,-.,./&$.%/0(%.1
!!
#
数)
!"
#
#
凌)
$
李)
%
宁)
!&
#
数理统计(研究生(教材!
'
#2$&$
!
中国版本图书馆3)4
数据核字*
$%&'
+第&(1,/'
号
出版!
中国科学技术大学出版社
安徽省合肥市金寨路(1
号#
$/%%$1
566
7
$''
7
89::#;:6<#9=;><?
印刷!
合肥学苑印务有限公司
发行!
中国科学技术大学出版社
经销!
全国新华书店
开本!
,&%@@A(1%@@
!
&
'
&1
印张!
$%#,0
字数!
'%,
千
版次!
$%&'
年(
月第&
版
印次!
$%&'
年(
月第&
次印刷
定价!
/1#%%
元
前!!
言
数理统计学是研究怎样用有效的方法去收集和使用具随机性影响的数据的科
学&当今信息时代是充满数据的时代#数据是信息的载体#数理统计作为一门分析
数据并从数据中寻找规律的学科#随着计算机的广泛使用#必然会发挥越来越重要
的作用&本书的理论和方法为解决实际问题中的数据分析问题提供了有力的工具&
!数理统计"课程是工科院校硕士研究生重要的学位课程之一&本书根据全国
工科院校硕士研究生!数理统计"课程教学的基本要求#在合肥工业大学数学学院
的老师多年从事工科研究生!数理统计"课程教学的基础上编写而成&在编写过程
中#针对工科院校研究生的数学基础和教学特点#在选材方面#突出数理统计的基
本理论和方法,在文字叙述方面#尽量做到由浅入深%循序渐进%言简意赅%分析透
彻,在应用方面#通过典型例子的分析及统计软件的使用#增强本课程的实用性&
除预备的知识外#全书共分-
章#内容包括$抽样分布%参数估计%假设检验%方差分
析%回归分析%正交试验设计%多元统计分析初步等#考虑到实际应用的需要#第-
章还介绍了!"!
及其在统计分析中的应用&本书各章末有适当习题#书末附有部
分习题参考答案&
本书的编写由凌能祥%李声闻和宁荣健/
位作者共同完成#具体分工如下$第&
章%第/
章和第-
章由李声闻编写,预备知识和第$
章由宁荣健编写#第'
章至第,
章由凌能祥编写&全书由凌能祥整理统稿&
本书的编写得到了合肥工业大学数学学院的大力支持#并得到了!合肥工业大
学研究生精品教材建设项目"的资助#与此同时#中国科学技术大学出版社做了大
量的服务工作#在此#编者致以衷心的感谢- 另外#在编写本书的过程中#引用了国
内外同行专家的相关书籍#均已列入参考文献中#谨向这些书籍的作者一并致以衷
心的谢忱-
由于编者水平有限#书中难免有疏漏或错误之处#敬请同行专家读者多提宝贵
意见#以便今后进一步修改与完善-
编!
者$%&'
年-
月于合肥工业大学
书书书
目!!
录
前言 !
!
"
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
预备知识 !
!
"
!!!!!!!!!!!!!!!!!!!!!!!!!!!!
!
"#!
!
随机事件及其概率 !
!
"
!!!!!!!!!!!!!!!!!!!!
!
"#$
!
一维随机变量及其分布 !
%
"
!!!!!!!!!!!!!!!!!!
!
"#&
!
二维随机变量及其分布 !
'
"
!!!!!!!!!!!!!!!!!!
!
"#%
!
随机变量的数字特征 !
!"
"
!!!!!!!!!!!!!!!!!!!
!
"#(
!
大数定律和中心极限定理 !
!&
"
!!!!!!!!!!!!!!!!!
第!
章!
抽样分布 !
!(
"
!!!!!!!!!!!!!!!!!!!!!!!!
!
!#!
!
基本概念 !
!(
"
!!!!!!!!!!!!!!!!!!!!!!!!
!
!#$
!
经验分布函数与直方图 !
$!
"
!!!!!!!!!!!!!!!!!!
!
!#&
!
抽样分布 !
$)
"
!!!!!!!!!!!!!!!!!!!!!!!!
!
习题!
!
&)
"
!!!!!!!!!!!!!!!!!!!!!!!!!!!!
第"
章!
参数估计 !
%!
"
!!!!!!!!!!!!!!!!!!!!!!!!
!
$#!
!
点估计量 !
%!
"
!!!!!!!!!!!!!!!!!!!!!!!!
!
$#$
!
估计量的评选标准 !
("
"
!!!!!!!!!!!!!!!!!!!!
!
$#&
!
区间估计 !
'&
"
!!!!!!!!!!!!!!!!!!!!!!!!
!
$#%
" 贝叶斯估计 !
)&
"
!!!!!!!!!!!!!!!!!!!!!!!
!
习题$
!
))
"
!!!!!!!!!!!!!!!!!!!!!!!!!!!!
第#
章!
假设检验 !
*$
"
!!!!!!!!!!!!!!!!!!!!!!!!
!
&#!
!
假设检验的基本思想 !
*$
"
!!!!!!!!!!!!!!!!!!!
!
&#$
!
单个总体参数的假设检验 !
**
"
!!!!!!!!!!!!!!!!!
!
&#&
!
两个总体参数的假设检验 !
+)
"
!!!!!!!!!!!!!!!!!
!
&#%
!
非参数假设检验 !
!"%
"
!!!!!!!!!!!!!!!!!!!!!
!
习题&
!
!$"
"
!!!!!!!!!!!!!!!!!!!!!!!!!!!!
第$
章!
方差分析 !
!$(
"
!!!!!!!!!!!!!!!!!!!!!!!!
!
%#!
!
单因素方差分析 !
!$(
"
!!!!!!!!!!!!!!!!!!!!!
!
%#$
!
双因素方差分析 !
!&(
"
!!!!!!!!!!!!!!!!!!!!!
!
习题%
!
!%*
"
!!!!!!!!!!!!!!!!!!!!!!!!!!!!
第%
章!
正交试验设计 !
!($
"
!!!!!!!!!!!!!!!!!!!!!!
!
(#!
!
正交设计与正交表 !
!($
"
!!!!!!!!!!!!!!!!!!!!
!
(#$
!
正交试验设计的方差分析 !
!(*
"
!!!!!!!!!!!!!!!!!
!
(#&
!
交互作用的正交试验设计及其结果分析 !
!'$
"
!!!!!!!!!!!
!
习题(
!
!''
"
!!!!!!!!!!!!!!!!!!!!!!!!!!!!
第&
章!
回归分析 !
!'*
"
!!!!!!!!!!!!!!!!!!!!!!!!
!
'#!
!
回归分析的基本概念 !
!'*
"
!!!!!!!!!!!!!!!!!!!
!
'#!
!
一元线性回归 !
!)"
"
!!!!!!!!!!!!!!!!!!!!!!
!
'#&
!
多元线性回归模型 !
!*(
"
!!!!!!!!!!!!!!!!!!!!
!
'#%
!
非线性回归 !
$"%
"
!!!!!!!!!!!!!!!!!!!!!!!
!
习题'
!
$!"
"
!!!!!!!!!!!!!!!!!!!!!!!!!!!!
第'
章!
多元统计分析初步 !
$!(
"
!!!!!!!!!!!!!!!!!!!!
!
)#!
!
主成分分析 !
$!(
"
!!!!!!!!!!!!!!!!!!!!!!!
!
)#$
!
因子分析 !
$$%
"
!!!!!!!!!!!!!!!!!!!!!!!!
!
)#&
!
典型相关分析 !
$&"
"
!!!!!!!!!!!!!!!!!!!!!!
!
习题)
!
$&%
"
!!!!!!!!!!!!!!!!!!!!!!!!!!!!
第(
章!
)*)
及其在统计分析中的应用 !
$&*
"
!!!!!!!!!!!!!!!
!
*#!
!
,-,
系统概述 !
$&*
"
!!!!!!!!!!!!!!!!!!!!!!
!
*#$
!
,-,
数据集的建立与整理 !
$("
"
!!!!!!!!!!!!!!!!!
!
*#&
!
常用统计描述过程 !
$'$
"
!!!!!!!!!!!!!!!!!!!!
!
*#%
!
假设检验 !
$*"
"
!!!!!!!!!!!!!!!!!!!!!!!!
!
*#(
!
,-,
的回归分析应用 !
$+"
"
!!!!!!!!!!!!!!!!!!!
部分习题参考答案 !
$+*
"
!!!!!!!!!!!!!!!!!!!!!!!!
附表 !
&"&
"
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
参考文献 !
&$'
"
!!!!!!!!!!!!!!!!!!!!!!!!!!!!
"
数 理 统 计
书书书
预 备 知 识
!"#
!
随机事件及其概率
!"#"#
!
随机试验!样本空间!随机事件
!"
随机试验
对随机现象进行一次观察!观察的过程称为试验"如果该试验满足#
$
!
%在相同条件下可重复进行$重复性%&
$
#
%试验有多种可能结果事先已知$明确性%&
$
$
%每次试验的具体结果在试验前无法预知$随机性%!
就称此试验为随机试验!简称为试验!记为!
"
#"
样本点
每一个试验结果称为一个样本点&试验的所有样本点的全体称为样本空间!记
为"
"
$"
随机事件
在随机试验中可能发生也可能不发生!但其发生的可能性可以度量的事件称
为随机事件"由此可知随机事件为样本点的集合!记为#
!
$
!
%
等"
%"
必然事件和不可能事件
每次试验中必然发生的事件称为必然事件!即为全集"
&每次试验中都不可能
发生的事件称为不可能事件!即为空集!记为"
"
!"#"$
!
事件的关系与运算
!"
事件的关系
$
!
%子事件$事件的包含%
#
#
$
#
#
发生必然导致$
发生&
$
#
%相等事件#&$
#若#
#
$
!
$
#
#
!就称#
!
$
相等$样本点完全相同%&
$
$
%并事件#
$
$
#
#
!
$
中至少发生一个&
$
%
%交$积%事件#$
或#
%
$
#
#
!
$
都发生&
$
'
%差事件#($
#
#
发生而$
不发生&
$
)
%互不相容$互斥%事件#
#$&
"
!即#
!
$
不可能同时发生&
$
*
%对立事件#在每次试验中!
#
不发生的事件记为#
!即若#
$
$&"
且
#$&
"
!则有$&#
"
#"
事件的运算
$
!
%交换律#
#
$
$&$
$
#
!
#$&$#
&
$
#
%结合律#$
#
$
$
%
$
%&#
$
$
$
$
%
%!$
#$
%
%&#
$
$%
%&
$
$
%分配律#$
#
$
$
%
%&
$
#%
%
$
$
$%
%!$
#$
%
$
%&
$
#
$
%
%$
$
$
%
%&
$
%
%摩根律#
#$&#
$
$
!
#
$
$&#$
"
!"#"%
!
概率的性质
$
!
%
&
$
"
%
&+
!
&
$
"
%
&!
!
+
&
&
$
#
%
&
!
&
$
#
%
&
$
#
%
&!(&
$
#
%&
$
$
%
&
$
#
$
$
%
&&
$
#
%
,&
$
$
%
(&
$
#$
%!
&
$
#
$
$
$
%
%
&&
$
#
%
,&
$
$
%
,&
$
%
%
(&
$
#$
%
(&
$
$%
%
(&
$
#%
%
,&
$
#$%
%&
特别地!若#
!
!
#
#
!'!
#
'
两两互斥!则&
$
#
!
$
#
#
$
'
$
#
'
%
&&
$
#
!
%
,
&
$
#
#
%
,
'
,&
$
#
'
%&
$
%
%
&
$
#($
%
&&
$
#$
%
&&
$
#
%
(&
$
#$
%!特别地!当$
#
#
时!
&
$
$
%
&
&
$
#
%"
!"#"&
!
三种常见概型
!"
古典概型
$
!
%特征#
"
中样本点有限且每个样本点等可能发生&
$
#
%公式#
&
$
#
%
&
#
中所含样本点总数
"
中所含样本点总数"
#"
几何概型
$
!
%特征#
"
中样本点无限且构成一个区域!每个样本点发生是等可能的&
$
#
%公式#
&
$
#
%
&
#
的几何测度
"
的几何测度!其中测度为长度或面积"
$"
伯努利概型
在每次试验中!事件#
发生的概率为(
!则在'
次重复独立试验$或称'
重伯
!
数 理 统 计
努利试验%中!事件#
恰好发生)
次的概率为-
)
'
(
)
$
!
*
(
%
'
*
)
$
)
+
+
!
!
!
#
!'!
'
%"
!"#"'
!
条件概率与概率的乘法公式
!"
条件概率
设&
$
#
%
'
+
!则在#
发生的前提下$
发生的概率为&
$
$ #
%!并有&
$
$ #
%
&&
$
#$
%(
&
$
#
%"
#"
概率的乘法公式
$
!
%
&
$
#$
%
&&
$
#
%
&
$
$ #
%
&&
$
$
%
&
$
# $
%&
$
#
%
&
$
#
!
#
#
#
$
%
&&
$
#
!
%
&
$
#
#
#
!
%
&
$
#
$
#
!
#
#
%!其中&
$
#
!
#
#
%
'
+
&
$
$
%
&
$
#
!
#
#
'
#
'
%
&&
$
#
!
%
&
$
#
#
#
!
%'
&
$
#
'
#
!
#
#
'
#
'(!
%"
!"#"(
!
全概率公式与贝叶斯公式
$
!
%全概率公式#如果事件组#
!
!
#
#
!'!
#
'
满足#
!
!'!
#
'
互不相容&且
$
'
,&!
#
,
&"
!就称#
!
!
#
#
!'!
#
'
构成"
的一个完备事件组!并有
&
$
$
%
+
(
'
,
+
!
&
$
#
,
%
&
$
$ #
,
%
!!
$
#
%贝叶斯公式#
&
$
#
,
$
%
+
&
$
#
,
$
%
&
$
$
%
+
&
$
#
,
%
&
$
$ #
,
%
&
$
$
%
"
!"#")
!
事件的独立性
$
!
%事件#
与$
独立#若&
$
#$
%
&&
$
#
%
&
$
$
%!就称#
与$
独立"
定理!-"
!
下列%
个命题是等价的#
!
#
与$
独立&
"
#
与$
独立&
#
#
与$
独立&
$
#
与$
独立"
$
#
%
#
!
$
!
%
相互独立#若&
$
#$
%
&&
$
#
%
&
$
$
%!
&
$
#%
%
&&
$
#
%
&
$
%
%!
&
$
$%
%
&&
$
$
%
&
$
%
%!就称#
!
$
!
%
两两独立&若#
!
$
!
%
两两独立!且&
$
#$%
%
&&
$
#
%
&
$
$
%
&
$
%
%!就称#
!
$
!
%
相互独立"
"
预 备 知 识
!"$
!
一维随机变量及其分布
!"$"#
!
随机变量
!!
$
!
%随机变量#设随机试验!
的样本空间"&
)
!
*!若对每一个!)
"
!均有一
个唯一的实数.
$
!
%与之对立!则称.
$
!
%为一个随机变量!记为.&.
$
!
%&
$
#
%设/
为任意实数集合!则.
)
) *
/
表示一个随机事件"
!"$"$
!
分布函数
$
!
%分布函数#称0
$
1
%
&& .
&
) *
1
$
(
.*
1
*
,
.
%为随机变量.
的分布
函数&
$
#
%分布函数的性质#
!
+
&
0
$
1
%
&
!
&
"
/01
1
+
(
.
0
$
1
%
&+
!
/01
1
+
,
.
0
$
1
%
&!
&
#
0
$
1
%是处处单调不减的函数&
$
0
$
1
%是处处右连续的函数&
$
$
%概率的计算#
&
)
2
*
.
&
3
*
+
0
$
3
%
*
0
$
2
%"
!"$"%
!
离散型随机变量
$
!
%离散型随机变量#若随机变量.
的取值为有限或可列无穷个!就称.
为
离散型随机变量"
$
#
%离散型随机变量的概率分布律为
&
)
.
+
1
,
*
+
(
,
!
$
,
+
!
!
#
!'%
或
.
1
!
1
#
'
1
,
'
&
(
!
(
#
'
(
,
'
或
.
"
1
!
1
#
'
1
,
'
(
!
(
#
'
(
,
,
-
.
/
'
!!
$
$
%分布律的性质#
!
(
,
0
+
$
,
+
!
!
#
!'%&
"
(
,
(
,
+
!
"
$
%
%概率的计算#设/
为任意实数集合!则& .
)
) *
/
+
(
1
,
)
/
(
,
"
#
数 理 统 计
!"$"&
!
连续型随机变量
!"
连续型随机变量
设随机变量.
的分布函数为0
$
1
%!若存在非负函数4
$
1
%!使得对任意实数1
均有0
$
1
%
+
1
1
*
.
4
$
5
%
25
!则称.
为连续型随机变量!
4
$
1
%是.
的概率密度函数"
结论!若.
为连续型随机变量"则其分布函数0
#
1
$必为连续函数%
#"
概率密度的性质
$
!
%
4
$
1
%
0
+
&
$
#
%
1
6
.
*
.
4
$
1
%
21
+
!
&
$
$
%
0!
$
1
%
+
4
$
1
%"
其中1
为4
$
1
%的连续点"
$"
概率的计算
$
!
%
&
)
1
+
2
*
+
+
+
2
)
$
*.
!
6.
%,&
$
#
%
& 2
&
.
&
) *
3
+
& 2
*
.
&
) *
3
+
& 2
*
.
*
) *
3
+
& 2
&
.
*
) *
3
+
0
$
3
%
*
0
$
2
%
+
1
3
2
4
$
1
%
21
"
!"$"'
!
常见分布
!"
常见的离散型分布
$
!
%
+(!
两点分布#
.
%
$
$
!
!
(
%#
& .&
) *
) &
(
)
$
!(
(
%
!()
!其中)&+
!
!
或
.
%
+ !
!(
$ %
( (
$
+
*
(
*
!
%&
$
#
%二项分布#
.
%
$
$
'
!
(
%#
& .&
) *
) &-
)
'
(
)
$
!(
(
%
'()
!其中)&+
!
!
!'!
'
&
.
表示在'
重独立重复试验中事件#
发生的次数!
&
$
#
%
&
(
&
$
$
%泊松分布.
%
&
$
#
%#
& .&
) *
) &
#
)
)
-
3
(
#
!其中)&+
!
!
!
#
!'&参数#'
+
"
#"
常见的连续型分布
$
!
%均匀分布#
4
$
1
%
&
!
3(2
!
2
&
1
&
3
!
+
! 其他2
,
-
!
!
0
$
1
%
&
+
!
1
*
2
!
1(2
3(2
!
2
&
1
&
3
!
!
!
1
0
3
2
,
-
&
$
#
%指数分布#
4
$
1
%
&
#
3
(
#
1
!
1
'
+
!
+
!
1
&
+
)
!
!
0
$
1
%
&
!(3
(
#
1
!
1
0
+
!
+
!
1
*
+
)
&
$
$
%正态分布#
.
"
7
$
$
!
%
#
%#
4
$
1
%
+
!
#槡&%
3
*
$
1
*$
%
#
#
%
#
!
0
$
1
%
+
1
1
*
.
!
#槡&%
3
*
$
5
*$
%
#
#
%
#
25
!
$
预 备 知 识
其中*.
*
1
*
6.
!
*.
*
$
*
6.
!
%
'
+
"
可见4
$
1
%的图像关于1&
$
对称&
0
$
1
%为1
的单调增函数"若$
&+
!
%
&!
!即
.
%
7
$
+
!
!
%!就称.
服从标准正态分布!其密度函数和分布函数分别记为
&
$
1
%
+
!
#槡&
3
*
1
#
#
!
!'
$
1
%
+
1
1
*
.
!
#槡&
3
*
5
#
#
25
!
$
*.
*
1
*
6.
%
其中'
$
1
%的值可通过查标准正态分布表求得!并且有'
$
(1
%
&!(
'
$
1
%"
若.
%
7
$
$
!
%
#
%!则$
.(
$
%(
%%
7
$
+
!
!
%!从而有
"#
*
$
&
) *
%
&'
%
'
$
$ %
%
''
#
'
$
$ %
%
!"$"(
!
随机变量函数的分布
!"
离散型随机变量函数的分布
设随机变量.
的分布律为&
)
.&1
,
*
&
(
,
$
,&!
!
#
!'%!则离散型随机变量函
数8&
9
$
.
%也为离散型随机变量!其分布律为&
)
8&
9
$
1
,
%*
&
(
,
$
,&!
!
#
!'%
+需要对9
$
1
,
%进行合并,"
#"
连续型随机变量函数的分布
设随机变量.
率密度为4
.
$
1
%!则连续型随机变量函数8&
9
$
.
%的分布函
数为
0
8
$
:
%
+
&
)
8
&:
*
+
&
)
9
$
.
%
&:
*
+
1
)
1
#
9
$
1
%
&:
*
4
.
$
1
%
21
若8
为连续型随机变量!则其密度函数为4
8
$
:
%
&0!
8
$
:
%"
!-%
!
二维随机变量及其分布
!-%-#
!
二维随机变量的联合分布函数
!-
二维随机变量的分布函数
!!
设$
.
!
8
%为二维随机变量!对于任意的实数1
!
:
!称二元函数0
$
1
!
:
%
&
& .
&
1
!
8
&
) *
:
为$
.
!
8
%的分布函数"
#"
二维随机变量分布函数的性质
$
!
%
+
&
0
$
1
!
:
%
&
!
&
$
#
%
/01
1
+
,
.
:
+
,
.
0
$
1
!
:
%
&!
!
/01
1
+
(
.
0
$
1
!
:
%
&/01
:
+
(
.
0
$
1
!
:
%
&/01
1
+
(
.
:
+
(
.
0
$
1
!
:
%
&+
"
%
数 理 统 计
$"
边缘分布函数
$
!
%称0
.
$
1
%
&&
)
.
&
1
*
&0
$
1
!
,
.
%$
(
.*
1
*
,
.
%为关于.
的边缘
分布函数&
$
#
%称0
8
$
:
%
&&
)
8
&
:
*
&0
$
,
.
!
:
%$
(
.*
:
*
,
.
%为关于8
的边缘
分布函数"
!"%"$
!
二维离散型随机变量
$
!
%二维离散型随机变量#若二维随机变量$
.
!
8
%的取值为有限或可列无穷
个!就称$
.
!
8
%为二维离散型随机变量&
$
#
%二维离散型随机变量的联合分布律#
& .&1
,
!
8&
:
) *
;
&
(
,
;
$
,&!
!
#
!
'&
;
&!
!
#
!'%&
$
$
%二维离散型随机变量的联合分布律的性质#
!
(
,
;
0
+
$
,
+
!
!
#
!'&
;
+
!
!
#
!'%&
"
(
,
(
;
(
,
;
+
!
&
#
设<
是1=
:
平面上任一区域!则&
$
.
!
8
%
)
) *
<
+
(
$
1
,
!
:
;
%
)
<
(
,
;
"
$
%
%边缘分布律$见表+-!
%#
& .
+
1
) *
,
+
(
;
(
,
;
+
2
(
,
3
!
$
,
+
!
!
#
!'%
& 8
+
:
) *
;
+
(
,
(
,
;
+
2
(3
;
!
$
;
+
!
!
#
!'%
表!#"
!
边缘分布表
!
.
8
!
1
!
1
#
'
1
,
'
:
!
(
!!
(
#!
'
(
,!
'
(
3
!
:
#
(
!#
(
##
'
(
,#
'
(
3
#
. . . ' . ' .
:; (
!
; (
#
;
'
(
,
;
'
(
3
;
. . . ' .
4
.
(
!
3
(
#
3
'
(
,
3
'
!
$
'
%条件分布律#
& .
+
1
,
8
+
:
) *
;
+
& .
+
1
,
!
8
+
:
) *
;
& 8
+
:
) *
;
+
(
,
;
(3
;
!
$
,
+
!
!
#
!'%
&
预 备 知 识
& 8
+
:
;
.
+
1
) *
,
+
& .
+
1
,
!
8
+
:
) *
;
& .
+
1
) *
,
+
(
,
;
(
,
3
!
$
;
+
!
!
#
!'%
!"%"%
!
二维连续型随机变量
$
!
%二维连续型随机变量#设二维随机变量$
.
!
8
%的分布函数为0
$
1
!
:
%!若
存在4
$
1
!
:
%
0
+
!使得0
$
1
!
:
%
+
1
:
*
.
1
1
*
.
4
$
>
!
?
%
2>2?
!则称$
.
!
8
%为二维连续
型随机变量!
4
$
1
!
:
%为$
.
!
8
%的概率密度!或.
和8
的联合密度函数"
$
#
%二维连续型随机变量概率密度的性质#
!
4
$
1
!
:
%
0
+
&
"
1
6
.
*
.
1
6
.
*
.
4
$
1
!
:
%
212
:
+
!
&
#
4
$
1
!
:
%
+
5
#
0
$
1
!
:
%
5
1
5
:
"
$
$
%设<
是1=
:
平面上任一区域!则&
$
.
!
8
%
)
) *
<
+
6
<
4
$
1
!
:
%
212
:
"
$
%
%边缘密度函数#
!
4
.
$
1
%
+
1
6
.
*
.
4
$
1
!
:
%
2
:
$
*.
*
1
*
6.
%为关于.
的
边缘密度函数&
"
4
8
$
:
%
+
1
6
.
*
.
4
$
1
!
:
%
21
$
*.
*:*
6.
%为关于8
的边缘密
度函数"
$
'
%条件密度函数#
4
. 8
$
1
:
%
+
4
$
1
!
:
%
4
8
$
:
%
!
$
*.
*
1
*
6.
%
4
8 .
$
:
1
%
+
4
$
1
!
:
%
4
.
$
1
%
!
$
*.
*:*
6.
%
!"%"&
!
随机变量的独立性
$
!
%定义#若对任意的1
!
:
均有0
$
1
!
:
%
&0
.
$
1
%
0
8
$
:
%!就称.
与8
独立"
$
#
%独立的充要条件#若$
.
!
8
%为二维离散型随机变量!则.
与8
独立的充
要条件为!对任意的,
!
;
均有(
,
;
&
(
,
/
(
/
;
&若$
.
!
8
%为二维连续型随机变量!则
.
与8
独立的充要条件为!对任意的1
!
:
均有4
$
1
!
:
%
&
4
.
$
1
%
4
8
$
:
%"
$
$
%关于随机变量独立性的两个结论#
!
若.
与8
独立!则对任意实数集合
/
!
!
/
#
有& .
)
/
!
!
8
)
/
) *
#
&& .
)
/
) *
!
& 8
)
/
) *
#
&
"
若9
!
$
1
%!
9
#
$
:
%是连
续函数!
.
与8
相互独立!则9
!
$
.
%与9
#
$
8
%也独立"
!"%"'
!
两个常见分布
$
!
%平面区域<
上的均匀分布#
4
$
1
!
:
%
&
!
<
的面积! $
1
!
:
%
)
<
!
+
! 其他2
,
-
&
'
数 理 统 计
$
#
%二维正态分布#
$
.
!
8
%
"
7
$
$
!
!
%
#
!
&
$
#
!
%
#
#
&
(
%
!
$
%
!
'
+
!
%
#
'
+
!
(
*
!
%
4
$
1
!
:
%
+
!
#
&%
!
%
#
!
*(
槡 #
34
5
*
!
#
$
!
*(
#
%
$
1
*$
!
%
#
%
+
)
#
!
!! !!
*
#
(
$
1
*$
!
%$
:
*$
#
%
%
!
%
#
6
$
:
*$
#
%
#
%
,
*
#
#
!"%"(
!
二维随机变量函数的分布
!"
二维离散型随机变量函数的分布
设二 维 离 散 型 随 机 变 量 $
.
!
8
%的 分 布 律 为& .&1
,
!
8&
:
) *
;
&
(
,
;
,&!
!
#
!'&
;
&!
!
#
$ %
!' !则二维离散型随机变量函数@&A
$
.
!
8
%的分布
律为&
)
@&A
$
1
,
!
:
;
%*
&
(
,
;
,&!
!
#
!'&
;
&!
!
#
$ %
!' +需要对A
$
1
,
!
:
;
%进行
合并,"
#"
二维连续型随机变量函数的分布
$
!
%设二维随机变量$
.
!
8
%概率密度为4
$
1
!
:
%!则二维连续型随机变量函数
@&A
$
.
!
8
%的分布函数为
0
@
$
B
%
+
&
)
@
&
B
*
+
&
)
A
$
.
!
8
%
&
B
*
+
6
A
$
1
!
:
%
&
B
4
$
1
!
:
%
212
:
若@
为连续型随机变量!则其密度函数为4
@
$
B
%
+
0!
@
$
B
%!特别地#
!
@
+
.
6
8
!
则4
@
$
B
%
+
1
6
.
*
.
4
$
1
!
B
*
1
%
21
+
1
6
.
*
.
4
$
B
*
:
!
:
%
2
:
&
"
设.
!
!
.
#
!'!
.
'
相互独
立!
.
,
的密度函数为4
,
$
1
%!分布函数为0
,
$
1
%$
,&!
!
#
!'!
'
%!
C&164
)
.
!
!
.
#
!'!
.
'
*!
7&107
)
.
!
!
.
#
!'!
.
'
*!则
0
C
$
1
%
+
0
!
$
1
%
0
#
$
1
%'
0
'
$
1
%!
!
4
C
$
1
%
+
0!
C
$
1
%
0
7
$
1
%
+
!
*
+
!
*
0
!
$
1
%,+
!
*
0
#
$
1
%,'+
!
*
0
'
$
1
%,
4
7
$
1
%
+
0!
7
$
1
%
!!
当.
!
!
.
#
!'!
.
'
独立同分布时!有
4
,
$
1
%
+
4
$
1
%!
!
0
,
$
1
%
+
0
$
1
%
!
$
,
+
!
!
#
!'!
'
%
0
C
$
1
%
+
+
0
$
1
%,
'
!
!
4
C
$
1
%
+
'
+
0
$
1
%,
'
*
!
4
$
1
%
0
7
$
1
%
+
!
*
+
!
*
0
$
1
%,
'
!
!
4
7
$
1
%
+
'
+
!
*
0
$
1
%,
'
*
!
4
$
1
%
(
预 备 知 识
!"&
!
随机变量的数字特征
!"&"#
!
数学期望
!"
离散型随机变量的数学期望
!!
$
!
%设离散型随机变量.
的分布律为& .
+
1
) *
,
+
(
,
$
,
+
!
!
#
!'%"若
(
,
1
,
(
,
绝对收敛!则称(
,
1
,
(
,
为.
的数学期望!记为!
$
.
%!即!
$
.
%
+
(
,
1
,
(
,
&
若(
,
9
$
1
,
%
(
,
绝对收敛!则!
+
9
$
.
%,
+
(
,
9
$
1
,
%
(
,
!特别地有!
$
.
#
%
+
(
,
1
,
#
(
,
"
$
#
%设二维离散型随机变量$
.
!
8
%的分布律为& .
+
1
,
!
8
+
:
) *
;
+
(
,
;
$
,
+
!
!
#
!'&
;
+
!
!
#
!'%"若(
,
(
;
A
$
1
,
!
:
;
%
(
,
;
绝对收敛!则!
+
A
$
.
!
8
%,
+
(
,
(
;
A
$
1
,
!
:
;
%
(
,
;
!特别地!
!
$
.
%
+
(
,
(
;
1
,
(
,
;
!
!
$
8
%
+
(
,
(
;
:
;
(
,
;
!
!
$
.8
%
+
(
,
(
;
1
,
:
;
(
,
;
等"
#"
连续型随机变量的数学期望
$
!
%设连续型随机变量.
的概率密度为4
$
1
%!若1
6
.
*
.
1
4
$
1
%
21
绝对收敛!则称
1
6
.
*
.
1
4
$
1
%
21
为.
的数学期望!记为!
$
.
%!即!
$
.
%
+
1
6
.
*
.
1
4
$
1
%
21
&若
1
6
.
*
.
9
$
1
%
4
$
1
%
21
绝对收敛!则!
+
9
$
.
%,
+
1
6
.
*
.
9
$
1
%
4
$
1
%
21
!特别地!
!
$
.
#
%
+
1
6
.
*
.
1
#
4
$
1
%
21
"
$
#
%设二维连续型随机变量$
.
!
8
%的概率密度为4
$
1
!
:
%!若1
6
.
*
.
1
6
.
*
.
9
$
1
!
:
%
4
$
1
!
:
%
212
:
绝对收敛!则!
+
9
$
.
!
8
%,
+
1
6
.
*
.
1
6
.
*
.
9
$
1
!
:
%
4
$
1
!
:
%
212
:
!特别
地!
!
$
.
%
+
1
6
.
*
.
1
6
.
*
.
1
4
$
1
!
:
%
212
:
!
!
$
8
%
+
1
6
.
*
.
1
6
.
*
.
:4
$
1
!
:
%
212
:
!
!
$
.8
%
+
1
6
.
*
.
1
6
.
*
.
1
:4
$
1
!
:
%
212
:
"
)*
数 理 统 计
$"
数字期望的性质
$
!
%
!
$
%
%
&%
&
$
#
%
!
$
2.
%
&2!
$
.
%&
$
$
%
!
$
.88
%
&!
$
.
%
8!
$
8
%&
$
%
%若.
!
8
相互独立!则有!
$
.8
%
&!
$
.
%
!
$
8
%"
!"&"$
!
方差
!"
方差的定义
!!
若!
+
.(!
$
.
%,
#存在!就称!
+
.(!
$
.
%,
#为随机变量.
的方差!记为
<
$
.
%!即有<
$
.
%
&!
+
.(!
$
.
%,
#
!将<
$
.槡 %称为.
的标准差"由此可得
<
$
.
%
&!
$
.
#
%
(
+
!
$
.
%,
#
"
#"
方差的性质
$
!
%
<
$
.
%
0
+
&
$
#
%
<
$
%
%
&+
!并且<
$
.
%
&+
的充要条件为&
)
.&%
*
&!
&
$
$
%
<
$
2.
%
&2
#
<
$
.
%!
<
$
2.,3
%
&2
#
<
$
.
%&
$
%
%若.
!
8
相互独立!则有<
$
.88
%
&<
$
.
%
,<
$
8
%"
!"&"%
!
常见分布的期望与方差
$
!
%两点分布#
!
$
.
%
&
(
!
<
$
.
%
&
(
$
!(
(
%&
$
#
%二项分布#
!
$
.
%
&'
(
!
<
$
.
%
&'
(
$
!(
(
%&
$
$
%泊松分布#
!
$
.
%
&<
$
.
%
&
#
&
$
%
%均匀分布#
!
$
.
%
&
2,3
#
!
<
$
.
%
&
$
3(2
%
#
!#
&
$
'
%指数分布#
!
$
.
%
&
!
#
!
<
$
.
%
&
!
#
#
&
$
)
%正态分布#
!
$
.
%
&
$
!
<
$
.
%
&
%
#
"
!"&"&
!
协方差
!"
协方差的定义
若!
)+
.(!
$
.
%,+
8(!
$
8
%,*存在!就称!
)+
.(!
$
.
%,+
8(!
$
8
%,*为
随机变量.
和8
的协方差!记为-9:
$
.
!
8
%!即有-9:
$
.
!
8
%
&!
)+
.(!
$
.
%,
/+
8(!
$
8
%,*"由此可得-9:
$
.
!
8
%
&!
$
.8
%
(!
$
.
%
!
$
8
%"
#"
协方差的性质
$
!
%
-9:
$
.
!
.
%
&<
$
.
%&
**
预 备 知 识
$
#
%
-9:
$
8
!
.
%
&-9:
$
.
!
8
%!
-9:
$
.
!
%
%
&+
&
$
$
%
-9:
$
2.
!
38
%
&23-9:
$
.
!
8
%&
$
%
%
-9:
$
.
!
8.
#
!
8
%
&-9:
$
.
!
!
8
%
8-9:
$
.
#
!
8
%&
$
'
%
<
$
.88
%
&<
$
.
%
,<
$
8
%
8#-9:
$
.
!
8
%&
$
)
%
<
$
.,8,@
%
&<
$
.
%
,<
$
8
%
,<
$
@
%
,#-9:
$
.
!
8
%
,#-9:
$
8
!
@
%
,#-9:
$
.
!
@
%"
!"&"'
!
相关系数
!"
相关系数的定义
若<
$
.
%!
<
$
8
%!
-9:
$
.
!
8
%都存在!且<
$
.
%
'
+
!
<
$
8
%
'
+
!则称(
.8
&
-9:
$
.
!
8
%
<
$
.槡 %
<
$
8槡 %
为随机变量.
和8
的相关系数&若(
.8
&+
!则称.
与8
不
相关"
#"
相关系数的性质
$
!
%
(
.8
&
!
!即(
.8
)
+
(!
!
!
,&
$
#
%
(
.8
&!
的充要条件为& 8&2.,
) *
3 &!
!其中2
7
+
且
(
.8
+
!
!
2
'
+
*
!
!
2
*
)
+
!!
$
$
%
.
与8
不相关!即(
.8
&+
8
-9:
$
.
!
8
%
&+
8
!
$
.8
%
&!
$
.
%
!
$
8
%
8
<
$
.88
%
&<
$
.
%
,<
$
8
%&
$
%
%若.
与8
独立 !则有.
与8
不相关!但若.
与8
不相关!则.
与8
不
一定独立"
!"&"(
!
正态分布的性质
$
!
%若.
%
7
$
$
!
%
#
%!则8&2.,3
%
7
$
2
$
,3
!
2
#
%
#
%$
2
7
+
%"
$
#
%若$
.
!
8
%
%
7
$
$
!
!
%
#
!
!
$
#
!
%
#
#
!
(
%!则
!
.
%
7
$
$
!
%
#
!
%!
8
%
7
$
$
#
!
%
#
#
%&
!
"
2.,38
$
2
#
,3
#
7
+
%服从正态分布!特别地!
.88
服从正态分布&
#
令D&2
!
.,3
!
8
!
E&2
#
.,3
#
8
!当2
!
3
!
2
#
3
#
7
+
时!
D
!
$ %
E
服从二
维正态分布&
$
.
与8
独立的充要条件为.
与8
不相关"
$
$
%若.
%
7
$
$
!
!
%
#
!
%!
8
%
7
$
$
#
!
%
#
#
%且.
与8
独立!则$
.
!
8
%服从二维正
!*
数 理 统 计
态分布"
$
%
%设.
,
"
7
$
$
,
!
%
#
,
%$
,
+
!
!
#
!'!
'
%且.
!
!
.
#
!'!
.
'
相互独立!则
(
'
,
+
!
2
,
.
,
"
7
(
'
,
+
!
2
,
$
,
!
(
'
,
+
!
2
,
#
%
#
$ %
,
$
2
,
不全为+
%"
!"&")
!
矩
$
!
%
)
阶原点矩#若!
$
.
)
%存在!就称!
$
.
)
%为.
的)
阶原点矩"一阶原点
矩为数学期望"
$
#
%
)
阶中心矩#若!
)+
.(!
$
.
%,
)
*存在!就称!
)+
.(!
$
.
%,
)
*为.
的)
阶中心矩"一阶中心矩!
+
.(!
$
.
%,
&+
!二阶中心矩为方差"
$
$
%
),F
阶混合矩#若!
$
.
)
8
F
%存在!就称!
$
.
)
8
F
%为$
.
!
8
%的),F
阶原
点矩&若!
)+
.(!
$
.
%,
)
+$
8(!
$
8
%,
F
*存在!就称!
)+
.(!
$
.
%,
)
+
8(!
$
8
%,
F
*
为$
.
!
8
%的),F
阶中心矩"
!"'
!
大数定律和中心极限定理
!"'"#
!
切比雪夫不等式
设!
$
.
%
&
$
!
<
$
.
%
&
%
#
!则对9)'
+
!有
& .
*
!
$
.
%
*
) *
)
0
!
*
<
$
.
%
)
#
或
& .
*
!
$
.
%
0
) *
)
&
<
$
.
%
)
#
!"'"$
!
依概率收敛
设8
!
!
8
#
!'!
8
'
!'是一随机变量序列!若对9)'
+
!有/01
'
+.
&
)
8
'
(2
*)
*
&!
$
2
为一常数%!则称该序列依概率收敛于2
"
!"'"%
!
大数定律
$
!
%切比雪夫大数定律#设.
) *
'
是相互独立的随机变序列!
!
$
.
'
%!
<
$
.
'
%
"*
预 备 知 识
均存在!且<
$
.
'
%
&
%
$
'
+
!
!
#
!'&
%
为某常数%!则对9)
'
+
!有
/01
'
+
.
&
!
'
(
'
,
+
!
.
,
*
!
'
(
'
,
+
!
!
$
.
,
%
*
) *
) +
!
!即.
) *
'
服从大数定律"
$
#
%辛钦大数定律#设随机变量.
!
!
.
#
!'!
.
'
!' 相互独立!且服从同一分
布!
!
$
.
,
%
+$
,
+
!
!
#
$ %
!' !则对9)
'
+
!有/01
'
+
.
&
!
'
(
'
,
+
!
.
,
*$
*
) *
) +
!
"
$
$
%伯努利大数定律#设'
#
是'
次独立试验中事件#
发生的次数!
(
是事件
#
在每次试验中发生的概率!则对9)'
+
!有/01
'
+.
&
'
#
'
(
(
*
) *
)
&!
"
!"'"&
!
中心极限定理
$
!
%独立同分布的中心极限定理$林德伯格 列维定理%#设.
!
!
.
#
!'!
.
'
!'
独立同分布!且!
$
.
,
%
+$
!
<
$
.
,
%
+%
#
'
+ ,
+
!
!
#
$ %
!' "令8
'
$
+
(
'
,
+
!
.
,
*
'
%
$
'
%
槡 #
$
,
+
!
!
#
!'%!其分布函数记作0
8
'
$
1
%!则有/01
'
+
.
0
8
'
$
1
%
+'
$
1
%
+
'
$
1
%为标准正态分布函数,"当'
充分大$
'
0
$+
%时!
8
'
"
近似
7
$
+
!
!
%!即有
(
'
,
+
!
.
,
"
近似
7
$
'
$
!
'
%
#
%"
$
#
%二项分布以正态分布为极限分布的中心极限定理$棣莫佛 拉普拉斯中心
极限定理%#设.
%
$
$
'
!
(
%!则当'
充分大$
'
0
$+
%时!
.
%
近似
7
+
'
(
!
'
(
$
!(
(
%,"
#*
数 理 统 计
第"
章!
抽 样 分 布
在预备知识中!我们讨论了概率论的基本内容!从本章开始所研究的内容属于
数理统计的范畴"数理统计属应用概率论知识!研究如何有效地对试验或观察得
到的数据进行收集0整理及分析!由此对研究的随机现象的规律性作出科学的推断
与决策"由于随机现象广泛存在于工农业生产0工程技术0自然科学和社会科学等
领域中!所以数理统计也有着广泛的应用"
本章将给出数理统计一些必要的基本概念!然后重点讨论几个常用的统计量
及正态总体抽样分布的一些重要结果"
#"#
!
基 本 概 念
本节介绍一些必要的概念与术语"
#"#"#
!
总体与样本
在数理统计中有两个重要的基本概念#总体0样本"
定义"-"
!
称研究对象的全体为总体或母体!而组成总体的每个元素称为个
体"从总体中抽取若干个个体组成的集体合称为样本$或子样%!样本中所含个体
的个数称为样本的容量"
在实际问题中!我们关心的往往不是研究对象本身或研究对象的所有特征!而
是它的某一个$或某几个%数量指标及这些指标的概率分布!因此也称这个$或这
些%数量指标为总体!记为.
"一方面!
.
一般是一个随机变量!而这个随机变量
.
的分布称为总体的分布"另一方面!根据总体中所含个体的个数是有限个或无
限个而将其称为有限总体或无限总体"
例如#研究一批灯泡的使用寿命!我们关心的并不是灯泡本身!而是灯泡的寿
命这个数量指标!则灯泡的使用寿命就是总体.
!
.
显然是个随机变量!
.
的分布
是我们希望知道的!而这个分布即为总体的分布"组成这个总体的每个灯泡的使
用寿命是个体!从这批产品中取出#+
个灯泡来考察其使用寿命!即构成了一个容
量为#+
的样本!通过研究此样本来对总体.
作出相应的估计与检验"
对样本中的每个个体而言!在试验或观测之前无法确定会得到一组怎样的数
据!因此样本是一组随机变量!记为.
!
!
.
#
!'!
.
'
!或记为一个随机向量$
.
!
!
.
#
!'!
.
'
%"而试验之后!这是一组确定的数值!称为样本值!记为$
1
!
!
1
#
!'!
1
'
%"样本$
.
!
!
.
#
!'!
.
'
%所有可能取值的全体称为样本空间!而样本值$
1
!
!
1
#
!'!
1
'
%为样本空间的一个样本点"
为便于讨论!我们有以下简单随机样本的概念"
定义"-$
!
设.
是一个总体!$
.
!
!
.
#
!'!
.
'
%是来自.
的样本!若满足#
$
!
%相互独立&
$
#
%每个.
,
$
,&!
!
#
!'!
'
%与总体.
同分布!
则称$
.
!
!
.
#
!'!
.
'
%为一组简单随机样本!简称样本"今后无特别说明时!样本
均指简单随机样本"
根据定义!若总体.
的分布函数为0
$
1
%!则样本$
.
!
!
.
#
!'!
.
'
%的联合分
布函数为
0
"
$
1
!
!
1
#
!'!
1
'
%
+
:
'
,
+
!
0
$
1
,
%
!!
.
是连续型随机变量时!
4
$
1
%是.
的密度函数!则样本$
.
!
!
.
#
!'!
.
'
%的
联合密度函数是
4
"
$
1
!
!
1
#
!'!
1
'
%
+
:
'
,
+
!
4
$
1
,
%
!!
.
是离散型随机变量时!总体的概率函数$分布律%是
(
$
1
%
+
&
)
.
+
1
*!
!
1
+
2
)
!
+
)
+
!
!
#
!'$有限个或可列个%,
则样本的联合概率函数$联合分布律%是
(
"
$
1
!
!
1
#
!'!
1
'
%
+
&
)
.
!
+
1
!
!
.
#
+
1
#
!'!
.
'
+
1
'
*
+
:
'
,
+
!
(
$
1
,
%
其中1
!
!
1
#
!'!
1
'
每一个值均含在.
的一切可能取值2
!
!
2
#
!'之中"
例"-"
!
对一批出厂的7
件产品检查其次品率!从中有放回地任取'
件!
.
分别取!
!
+
以分别表示每次取得的产品是次品或正品!
(
表示取得次品的概率!则
总体.
服从参数为(
的+ !
分布!对应的分布律可写为
&
)
.
+
1
*
+
(
1
$
!
*
(
%
!
*
1
!
$
1
+
+
!
!
%
!!
这里抽取得到的观察结果$
.
!
!
.
#
!'!
.
'
%是一个简单随机样本!即.
!
!
.
#
!'!
.
'
相互独立且均服从参数为(
的+ !
分布!样本的联合分布律为
&
)
1
!
!
1
#
!'!
1
'
*
+
:
'
,
+
!
(
1
,
$
!
*
(
%
!
*
1
,
%*
数 理 统 计
其中1
,
&+
!
!
$
,&!
!
#
!'!
'
%"
每组观察值$
1
!
!
1
#
!'!
1
'
%为由+
!
!
组成的'
维向量!其对应的样本空间是
*+
)$
1
!
!
1
#
!'!
1
'
%
G
1
,
+
+
!
!
$
,
+
!
!
#
!'!
'
%*
共有#
' 个样本点"
注意!对于有限总体.
而言"有放回抽样能保证抽样的独立性"当总体是可列
个#可数个$时"有放回与不放回抽样是没有区别的%因此"当总体中个体的个数7
很大"样本的容量相应较小#一般要求比值不超过'H
$时"可将总体视为是无限
的"使用不放回抽样代替有放回抽样"认为所取样本#
.
!
"
.
#
"&"
.
'
$是简单随机
样本%
#"#"$
!
统计量与常用统计量
样本是对总体进行统计分析与推断的重要依据!但实际上我们往往不直接利
用样本进行推断!而需要对样本进行适当的1加工2及1提炼2!将分散于样本中所含
总体的信息集中起来!对不同的问题构造不同的样本函数!为此以下给出统计量的
概念"
定义"-%
!
设$
.
!
!
.
#
!'!
.
'
%是来自总体.
的一个样本!且9
$
1
!
!
1
#
!'!
1
'
%是一个'
元连续函数!若样本函数
I
+
9
$
.
!
!
.
#
!'!
.
'
%
不含有任何未知参数!则称其为一个统计量"
显然!统计量也是一个随机变量且不含未知参数"由于样本具二重性!统计量也
具有二重性"当样本的一组观测值$
1
!
!
1
#
!'!
1
'
%确定时!统计量I&
9
$
.
!
!
.
#
!
'!
.
'
%也是一个确定的值!即5&
9
$
1
!
!
1
#
!'!
1
'
%"
例"-$
!
设总体.
%
7
$
$
!
%
#
%!
$
未知!
%
#已知!$
.
!
!
.
#
!'!
.
'
%是.
的一
个样本!则
9
!
$
.
!
!
.
#
!'!
.
'
%
+
.
!
6
!
!
9
#
$
.
!
!
.
#
!'!
.
'
%
+
164
!
&
,
&
'
)
.
,
*
*
107
!
&
,
&
'
)
.
,
*!
9
$
$
.
!
!
.
#
!'!
.
'
%
+
!
'
(
'
,
+
!
.
,
!
9
%
$
.
!
!
.
#
!'!
.
'
%
+
!
%
#
(
'
,
+
!
.
,
6
#
均是统计量!而
9
'
$
.
!
!
.
#
!'!
.
'
%
+
!
'
:
'
,
+
!
$
.
,
*$
%
#
&*
第!
章!
抽 样 分 布
不是统计量!因为其含有未知参数$
"
以下介绍一些常见的统计量"
!"
样本矩
首先回顾前述随机变量.
的矩"若.
是总体!则称$
)
&!
$
.
)
%是总体的!
阶原点矩&
+
)
&!
+
.(!
$
.
%,
) 是总体的!
阶中心矩"相应地有以下样本矩的
概念"
定义"-&
!
设$
.
!
!
.
#
!'!
.
'
%是来自总体.
的一个样本!则称
#
)
+
!
'
(
'
,
+
!
.
)
,
!
$
)
+
!
!
#
!'%
为样本的!
阶原点矩&称
$
)
+
!
'
(
'
,
+
!
$
.
,
*
.
%
)
!
$
)
+
!
!
#
!'%
为样本的!
阶中心矩!其中.
+
!
'
(
'
,
+
!
.
,
"特别地!称
.
+
!
'
(
'
,
+
!
.
,
为样本均值$一阶原点矩%&称
"
#
+
!
'
*
!
(
'
,
+
!
$
.
,
*
.
%
#
为样本方差&称
"
#
'
+
!
'
(
'
,
+
!
$
.
,
*
.
%
#
为样本二阶中心矩"
而对应的标准差为
"
+
!
'
*
!
(
'
,
+
!
$
.
,
*
.
%
槡#
!
!
"
'
+
!
'
(
'
,
+
!
$
.
,
*
.
%
槡#
!!
实际上!
#
!
&.
!
$
#
&"
#
'
"不难证明计算公式
"
#
+
!
'
*
$
!
(
'
,
+
!
.
#
,
*
'.
%
#
!
$
!-!
%
而
"
#
'
+
!
'
(
'
,
+
!
.
#
,
*
.
#
!
$
!-#
%
以上这些统计量统称为样本矩"
样本均值刻画样本的位置特征!而样本方差或对应样本标准差刻画样本的分
'*
数 理 统 计
散特征"
当$
1
!
!
1
#
!'!
1
'
%是一组具体样本值时!对应的样本均值与样本方差的是具
体的数值!分别为
1
+
!
'
(
'
,
+
!
1
,
J
#
'
+
!
'
(
'
,
+
!
$
1
,
*
1
%
#
+
!
'
(
'
,
+
!
1
#
,
*
1
#
!
$
!-$
%
J
#
+
!
'
*
!
(
'
,
+
!
$
1
,
*
1
%
#
+
!
'
*
$
!
(
'
,
+
!
1
#
,
*
'1
%
#
!
$
!-%
%
!!
需要指出!若总体.
的)
阶矩存在!则样本的)
阶矩必依概率收敛于总体的
)
阶矩!例如#
$
)
&!
$
.
)
%是总体的)
阶原点矩!而#
)
+
!
'
(
'
,
+
!
.
)
,
是样本的)
阶
原点矩"由于.
!
!
.
#
!'!
.
'
相互独立且与总体.
同分布!故.
)
!
!
.
)
#
!'!
.
)
'
也相
互独立且与.
)同分布"由独立同分布的辛钦大数定理可知!当'
+
.
时!
#
)
依概
率收敛于$
)
!即对任意)
'
+
有
/01
'
+
.
&
)
G$
)
*
#
)
G
*
)
*
+
!
#"
顺序统计量
定义"-'
!
设$
.
!
!
.
#
!'!
.
'
%是来自总体.
的一个样本!$
1
!
!
1
#
!'!
1
'
%是
对应的样本值!对$
1
!
!
1
#
!'!
1
'
%的值由小到大重新排列为
1
;
!
&
1
;
#
&
'
&
1
;
'
1
;
,
对应的样本分量
.
;
,
+
.
;
,
$
.
!
!
.
#
!'!
.
'
%
!
$
,
+
!
!
#
!'!
'
%
是样本的函数!称$
.
;
!
!
.
;
#
!'!
.
;
'
%为样本$
.
!
!
.
#
!'!
.
'
%的顺序统计量&而称
$
1
;
!
!
1
;
#
!'!
1
;
'
%为顺序统计量值&称
K
+
.
;
'
*
.
;
!
+
164
!
&
,
&
'
)
.
,
*
*
107
!
&
,
&
'
)
.
,
*
!
$
!-'
%
为样本极差&称
C
2
+
.
;
$
'
6
!
%(
#
!
'
为奇数
!
#
$
.
;
'
(
#
6
.
;
'
(
#
6
!
%!
'
2
,
-
为偶数!
$
!-)
%
为样本中位数"
样本的极差K
与样本的中位数C
2
比较容易计算"极差K
刻画了样本的分
散特征!中位数C
2
刻画了样本的位置特征"
例"-%
!
设两组样本值分别是#
(*
第!
章!
抽 样 分 布
$
!
%
#
!
$
!
!
!
+
!
%
!
#
!
(!
&
$
#
%
#
!
%
!
+
!
!
!
#
!
!
"
试写出对应的极差与中位数"
解!
$
!
%由小到大重新排列得(!
!
+
!
!
!
#
!
#
!
$
!
%
!则极差K&%(
$
(!
%
&'
!中
位数C
2
&#
&
$
#
%由小到大重新排列得+
!
!
!
!
!
#
!
#
!
%
!则极差K&%(+&%
!中位数C
2
&$
(
#
"
$"
样本频率分布与频数分布
样本分布刻画了样本中数据的分布情况!其定义的方式类似于总体的分布!通
常有频数分布及频率分布"对一样本值$
1
!
!
1
#
!'!
1
'
%!我们有以下定义"
定义"-(
!
对样本值$
1
!
!
1
#
!'!
1
'
%的数据由小到大重新排列!相同的合并!
设样本中不同的数值为1
;
!
!
1
;
#
!'!
1
;
L
!相应的频数为'
!
!
'
#
!'!
'
L
!相应的频率
为4
!
!
4
#
!'!
4
L
"其中若1
;
!
*
1
;
#
*
'
*
1
;
L
!
(
L
,
+
!
4
,
+
!
!则称表!-!
为样本的频
数分布与样本的频率分布表"
表"#"
!
样本的频数分布与频率分布表
. 1
;
!
1
;
#
'
1
;
L
频数'
,
'
!
'
#
'
'
L
频率4
,
4
!
4
#
'
4
L
例"-&
!
在某次数学考试中!抽取!+
份同学的试卷!成绩分别是#
;'
!
<+
!
*+
!
)'
!
<+
!
*'
!
*'
!
;<
!
<+
!
)+
"将这!+
个成绩从小到大重新排列为#
)+
!
)'
!
*+
!
*'
!
*'
!
<+
!
<+
!
<+
!
;'
!
;<
"相同的数合并可得表!-#
"
表"#$
!
成绩的频数分布与频率分布表
. )+ )' *+ *' <+ ;' ;<
频数'
,
! ! # # $ ! !
频率4
,
!
(
!+ !
(
!+ #
(
!+ #
(
!+ $
(
!+ !
(
!+ !
(
!+
可以证明!对以上样本值$
1
!
!
1
#
!'!
1
'
%用频数分布给出时!样本均值
1
+
!
'
(
L
,
+
!
'
,
1
,
样本方差
J
#
+
!
'
*
!
(
L
,
+
!
'
,
$
1
,
*
1
%
#
+
!
'
*
$
!
(
L
,
+
!
'
,
1
#
,
*
'1
%
#
!
$
!-*
%
)!
数 理 统 计
样本二阶中心距
J
#
'
+
!
'
(
L
,
+
!
'
,
$
1
,
*
1
%
#
+
!
'
(
L
,
+
!
'
,
1
#
,
*
1
#
!
$
!-<
%
#"$
!
经验分布函数与直方图
经验分布函数与直方图是两个主要的样本分布!本节将介绍这两个分布及它
们与总体分布的关系"
#"$"#
!
经验分布函数
以下给出经验分布函数定义"
定义"-)
!
设$
.
!
!
.
#
!'!
.
'
%是总体.
的一个样本!$
.
;
!
!
.
;
#
!'!
.
;
'
%为
样本$
.
!
!
.
#
!'!
.
'
%的顺序统计量!对任意实数1
!称
0
;
'
$
1
%
+
+
!
1
*
.
;
!
)
'
!
.
;
)
&
1
*
.
;
)
6
!
!
!
1
0
.
;
2
,
-
'
!
$
)
+
!
!
#
!'!
'
*
!
%
!
$
!-;
%
是样本$
.
!
!
.
#
!'!
.
'
%的经验分布函数"
经验分布函数0
;
'
$
1
%的图像是单调非降的阶梯形函数曲线!在.
;
,
*
.
;
,,!
的
区域其跃度为!
(
'
!见图!-!
"
图"""
!
经验分布函数#
;
$
!
%
"的图像
*!
第!
章!
抽 样 分 布
一方面!由定义!-*
不难看出0
;
'
$
1
%具有如下性质#
$
!
%
+
&
0
;
'
$
1
%
&
!
&
$
#
%单调非降右连续!即对任意1
!
*
1
#
!有0
;
'
$
1
!
%
&
0
;
'
$
1
#
%!且对任意的1
!
有0
$
1,+
%
&0
$
1
%&
$
$
%
0
;
'
$
(
.
%
&/01
1
+
(
.
0
;
'
$
1
%
&+
!
0
;
'
$
,
.
%
&/01
1
+
,
.
0
;
'
$
1
%
&!
"
这$
条性质是与总体.
的分布函数0
$
1
%的性质相同的基本性质"
另一方面!由于样本$
.
!
!
.
#
!'!
.
'
%是一组随机变量!所以每一组样本值对
应于不同的0
;
'
$
1
%"显然经验分布函数0
;
'
$
1
%是样本的函数!因此0
;
'
$
1
%是一
个统计量!即0
;
'
$
1
%也是随机变量"
下面考察'
+.
时!
0
;
'
$
1
%的极限情况"
对于每一个固定的1
!
0
$
1
%表示事件1
.
&
1
2的概率大小!即0
$
1
%
&&
)
.
&
1
*"
而作为一个随机变量!
0
;
'
$
1
%的可能取值是+
!
!
(
'
!
#
(
'
!'!$
'(!
%(
'
!
!
"由于.
!
!
.
#
!'!
.
'
相互独立且与总体.
具有相同的分布函数0
$
1
%!所以0
;
'
$
1
%
&)
(
'
表示'
重伯努利试验中事件1
.
&
1
2发生的频率!而
&
)
'0
;
'
$
1
%
+
)
*
+
-
)
'
(
)
$
!
*
(
%
'
*
)
!
$
)
+
+
!
!
!
#
!'!
'
%
其中(
&0
$
1
%
&&
)
.
&
1
*是总体.
的分布函数"由此可知!随机变量'0
;
'
$
1
%
服从二项分布$
$
'
!
(
%"对于固定的1
!由大数定律知!对于任意)'
+
!有
/01
'
+
.
&
)
G
0
;
'
$
1
%
*
0
$
1
%
G
*
)
*
+
!
即0
;
'
$
1
%依概率收敛于0
$
1
%"对于每一个固定的1
和任意一个很小的正数)
!当
'
很大时!事件1
<
0
;
'
$
1
%
(0
$
1
%
<*)
2几乎每次均会发生"利用这样一个推断原
理!在一次抽样中此事件必会发生!即我们可以在一次抽样后作出确定的0
;
'
$
1
%
来近似总体.
的分布函数0
$
1
%"在通常情况下!当'
很大时!对每一个确定的
1
!可以用样本的经验分布函数0
;
'
$
1
%作总体分布函数0
$
1
%的近似分布"但必须
指出的是!这里'
的大小依赖于1
"这是因为由大数定律知!1
0
;
'
$
1
%依概率收敛
于0
$
1
%2是对每一个固定1
而言的!因此这有很大的局限性"
另外!还有更加深入全面的结果!
=
/格列文科$
=">/0:37?9
%于!;'$
年证明
了以下结论#
定理"-"
#格列文科定理$
!
设总体.
的分布函数是0
$
1
%!而0
;
'
$
1
%是样本
的经验分布函数!令
<
'
+
@A
5
*
.
*
1
*
6
.
G
0
;
'
$
1
%
*
0
$
1
%
G
则对任意的)'
+
!有
/01
'
+
.
&
)
<
'
*
)
*
+
!
!
$
!-!+
%
即1经验分布函数0
;
'
$
1
%依概率收敛于分布函数0
$
1
%2对任意的1
均成立"其
!!
数 理 统 计
中!记号1
@A
5
2表示上确界!
"
本定理的证明超出本课程大纲的要求!故略去"
定理!-!
指出!对任意一个给定的很小的正数)
!在'
充分大时!对于一切1
!
1
<
0
;
'
$
1
%
(0
$
1
%
<*)
2均是大概率事件"因此!在'
很大时!一次抽样后获得的
0
;
'
$
1
%可以作为总体分布函数0
$
1
%的近似!而此时对所有1
是一致的!即'
很大
时!对于任何1
!
0
;
'
$
1
%均是总体分布0
$
1
%的一个良好的估计"需要指出!这里要
求'
很大!即我们通常所说的大样本情况$抽取样本容量很大%"
例"-'
!
从总体.
中取一个容量'&)
的样本!其观测值为(!-+
!
!-)
!
(#-$
!
#-!
!
$-)
!
!-)
"求经验分布函数0
;
'
$
1
%并作出对应图像"
解!
对这)
个值重新排列可得#
(#-$
!
(!-+
!
!-)
!
!-)
!
#-!
!
$-)
"由0
;
'
$
1
%
的定义可得
0
;
'
$
1
%
+
!
(
)
!
*
#-$
&
1
*
*
!-+
!
(
$
!
*
!-+
&
1
*
!-)
#
(
$
!
!-)
&
1
*
#-!
'
(
)
!
#-!
&
1
*
$-)
!
!
1
0
$-
2
,
-
)
如图!-#
所示"
图""$
!
#
;
$
!
%
"的图像
#"$"$
!
直方图
总体.
按数量指标分成离散型总体与连续型总体"离散型是指它只能取有
限个或可列多个值!如两点分布的总体0二项分布的总体"连续型是指它能取某个
区间中任意实数值!如长度0面积0温度0寿命等"
!!!
函数的上确界@A
5
(
.*
1
*
,
.
4
$
1
%表示!定义在(
.*
1
*
,
.
上的有界函数4
$
1
%的函数值的所有上界
中的最小值&相应的函数的下确界07B
(
.*
1
*
,
.
4
$
1
%为4
$
1
%在(
.*
1
*
,
.
上的下界中的最大值"
"!
第!
章!
抽 样 分 布
对于连续型总体!其分布通常可用分布密度表示!而相应的样本密度可用直方
图表示"实际上!$
.
!
!
.
#
!'!
.
'
%是总体.
的一个样本!我们可用样本的频率直
方图对总体.
的分布密度作一个粗略的描述"由于直方图形象直观0方便易行!
所以在生产管理与统计工作中经常使用到"
以下介绍作直方图的方法与步骤"
设.
是连续型总体!而$
1
!
!
1
#
!'!
1
'
%是.
的一组样本值"
!"
数据处理
$
!
%找样本中最大值0最小值#
1
;
'
+
164
!
&
,
&
'
)
1
,
*!
!
1
;
!
+
107
!
&
,
&
'
)
1
,
*
!!
$
#
%分组#
!
由样本容量'
的大小确定分组数L
"一般地#
6-'
小于'+
!
L
取值范围为'
%
)
&
C-'
在'+
%
!++
之间!
L
取值范围为)
%
!+
&
D-'
在!++
%
#'+
之间!
L
取值范围为!+
%
!'
&
2-'
大于#'+
时!
L
取值范围为!'
%
#+
"
"
确定组矩M
及各组的分点5
,
"极差K&1
;
'
(1
;
!
!则组矩由公式M&K
(
L
适当地选择"
取2
略小于1
;
!
!
3
略大于1
;
'
!由分点
2
+
5
+
*
5
!
*
5
#
*
'
*
5
L
*
!
*
5
L
+
3
作分组区间+
5
,(!
!
5
,
%$
,&+
!
!
!
#
!'!
L
%"
$
$
%作分组数据统计表$表!-$
%"
表"#%
!
分组数据统计表
序号 分组区间组中值
1
;
,
&!
(
#
$
5
,(!
,5
,
%
频数'
,
频率4
,
纵坐标
:
,
&
4
,
(
M
!
+
5
+
!
5
!
%
1
;
!
'
!
4
!
:
!
#
+
5
!
!
5
#
%
1
;
#
'
#
4
#
:
#
. . . . . .
L
+
5
L(!
!
5
L
,
1
;
L
'
L
4
L
:
L
(
' !
!!
注#其中'
,
表示落入第,
个区间+
5
,(!
!
5
,
%的样本值$
1
!
!
1
#
!'!
1
'
%的个数!
:
,
&
4
,
(
M&'
,
($
'
/
M
%"
$
%
%作直方图"在1=
:
平面中的每个区间+
5
,(!
!
5
,
%上作以:
,
为高的小矩
#!
数 理 统 计
形!由此可得如图!-$
的频率直方图"
图"#%
!
频率直方图
当'
很大时!由大数定律得
4
,
=
&
)
5
,
*
!
&
.
&
5
,
*
+
1
5
,
5
,
*
!
4
$
1
%
21
其中4
$
1
%是.
的密度函数"由此可得
:
,
+
!
M
1
5
,
5
,
*
!
4
$
1
%
21
+
4
$
,
,
%
!
$
5
,
*
!
&
,
,
&
5
,
%
进而可得+
5
,(!
!
5
,
%上的直方图面积大小近似于同底上密度函数4
$
1
%在区间
+
5
,(!
!
5
,
%上的平均高度"因此!我们可以通过每个小长方形的顶作一条光滑曲线
:
&
&
$
1
%!这条曲线可作为总体.
密度函数4
$
1
%的一条近似曲线"实际上这也是
直方图的实用价值"
注意以下两点#
图"#&
!
频率分布图
!
若数据1
,
$
,&+
!
!
!
#
!'!
L
%比较大
且复杂!我们可适当地选择)
与N
!作1!
,
+
)
$
1
,
*
N
%的数据线性处理!从而使得数据
1!
!
!
1!
#
!'!
1!
'
比较整齐!以便于计算&
"
若.
是离散型随机变量!$
1
!
!
1
#
!'!
1
'
%是.
的一样本值!对应的取值
为$
2
!
!
2
#
!'!
2
L
%$
L
*
'
%!
'
,
是样本值
$
1
!
!
1
#
!'!
1
'
%中取得2
,
的频数!则2
,
的频率是4
,
&'
,
(
'
$
,&+
!
!
!
#
!'!
L
%"
此时!我们得到一个频率分布图$图!-%
%"
而分布图上对应的频率4
,
裂成的列称为频率分布表"在'
很大时!频率分布表是
总体.
的分布的近似分布"
$!
第!
章!
抽 样 分 布