## 區間估計
用點估計θ^(X1,X2,…,Xn)來估計總體的未知參數 θ,一旦我們獲得了樣本觀察值 (x1,x2,…,xn),將它代入θ^(X1,X2,…,Xn),即可得到θ的一個估計值。這很直觀,也很便于使用。但是,點估計值只提供了θ的一個近似值,并沒有反映這種近似的精確度。同時,由于θ本身是未知的,我們也無從知道這種估計的誤差大小。因此,我們希望估計出一個真實參數所在的范圍,并希望知道這個范圍以多大的概率包含參數真值,這就是參數的區間估計問題。
### 定義
設θ為總體ξ的未知參數,ξ1,ξ2,…,ξn為ξ的一個子樣,T1(ξ1,ξ2,…,ξn),T2(ξ1,ξ2,…,ξn) 為兩個統計量。對于任意給定的α(0<α<1),若T1,T2滿足
P{T1≤θ≤T2}=1?α
——(4)
則稱隨機區間[T1,T2]為θ的置信水平為1?α的區間估計,α為顯著性水平,T1,T2分別稱為置信下限和置信上限.
注意:也稱T2?T1為該區間估計的精度。
值得注意的是,置信區間(θ^1,θ^2)是一個隨機區間,對于給定的樣本(X1,X2,…,Xn), 可能包含未知參數(θ^1,θ^2),也可能不包含θ。但(4)表明,在重復取樣下,將得到許多不同的區間θ^1(x1,x2,…,xn)、θ^2(x1,x2,…,xn),根據貝努利大數定律,這些區間中大約有100(1?α) 的區間包含未知參數θ 。
置信度表示區間估計的可靠度,置信度1?α越接近于1越好。區間長度則表示估計的范圍,即估計的精度,區間長度越短越好。當然,置信度和區間長度是相互矛盾的。在實際問題中,我們總是在保證可靠度的前提下,盡可能地提高精度。因此區間估計的問題,就是在給定α值的情況下,利用樣本(X1,X2,…,Xn)去求兩個估計量θ^1和θ^2 的問題。
### 置信區間的含義
以α=0.01為例,此時置信度為99。假設反復抽取樣本1000次,則得到1000個隨機區間[T1,T2],在這1000個區間中,包含值的大約有990個,而不包含θ值的大約有10個。
### 構造區間估計的步驟
1.構造一個與θ有關的函數
{U不含其它未知參數已知U的分布
2.對給定的
α(0<α<1)
,求
a,b
使得
P{a≤U≤b}=1?α
3.解不等式
a≤U≤b?T1≤θ≤T2
,得到區間
[T1,T2]
### 正態總體均值與方差的區間估計
設ξ~N(a,σ2),ξ1,…,ξn為ξ的一子樣
### 單個總體ξ~N(a,σ2)的情形
#### σ2=σ20已知時,求a的區間估計
因為ξˉ是a的最優無偏估計,因此在求a的區間估計時,自然從ξˉ出發來構造一個適合的函數。因為
ξ~N(a,σ20)?ξˉ~N(a,σ20n)
令U=ξˉ?aσ0/n√,則U~N(0,1)
對給定的α(0<α<1),求uα,使得
P{|U|≤uα}=1?α——(?)
臨界值uα可由P{U≤uα}=1?α2,查N(0,1)分布表得到
(*)式變為
P{|ξˉ?aσ/n√|≤uα}=1?α
亦是
P{ξˉ?uασ0n√≤a≤ξˉ+uασ0n√}=1?α
因此a的置信水平為1?α的區間估計為
[ξˉ?uασ0n√,ξˉ+uασ0n√]
不同置信水平1?α下,a的區間估計為

##### 例題
設某種清漆的9個樣品,其干燥時間(以小時計)分別為6.0,5.7,5.8,6.5,7.0,6.3,5.6,6.1,5.0 ,
設干燥時間總體服從正態分布N(a,0.62),求a的置信
水平為0.95的置信區間。
解:
σ2=0.62已知,n=9,α=1?0.95=0.05
取U=ξˉ?aσ0/n√~N(0,1)
由P{|U|≤uα}=1?α可得P{U≤uα}=1?α2=0.975
查標準正態分布表得到uα=1.96,故所求的置信水平為0.95的置信區間為
[Xˉˉˉ?uασ0n√,Xˉˉˉ+uασ0n√]=[5.0608,6.392]
#### σ2未知時,求a的區間估計
取T=n?1?????√ξˉ?aS~t(n?1)
對給定的α(0<α<1),求一個t(n?1)(α),使得
P{|T|≥tn?1(α)}=α
查t分布表可求得tn?1(α)
P{|n?1?????√ξˉ?aS|≥tn?1(α)}=α
即
P{ξˉ?tn?1(α)Sn?1?????√≤a≤ξˉ+tn?1(α)Sn?1?????√}=α
得到a的置信度為1?α的置信區間為
[ξˉ?tn?1(α)Sn?1?????√,ξˉ+tn?1(α)Sn?1?????√]
##### 例題
設某種清漆的9個樣品,其干燥時間(以小時計)分別為6.0,5.7,5.8,6.5,7.0,6.3,5.6,6.1,5.0 ,
設干燥時間總體服從正態分布N(a,σ2),σ2>0未知,求a的置信
水平為0.95的置信區間。
解:
σ2>0未知,n=9,α=1?0.95=0.05
取T=n?1?????√ξˉ?aS~t(n?1)=t(8)
由P{|T|≥t8(α)}=α=0.05
查t(8)分布表可以得到t8(α)=2.306,故所求的區間估計為
[ξˉ?tn?1(α)Sn?1?????√,ξˉ+tn?1(α)Sn?1?????√]
計算得ξˉ=6.0?S2=0.29
故所求a的區間估計為[5.558,6.442]
#### (總體均值未知時)σ2的區間估計
取χ2=nS2σ2~χ2(n?1)
給定的α(0<α<1),求一個λ1,一個λ2,使得
P{λ1≤χ2≤λ2}=1?α

P{χ2n?1(1?α2)≤χ2≤χ2n?1(α2)}=1?α
P{χ2n?1(1?α2)≤nS2σ2≤χ2n?1(α2)}=1?α
即
P{nS2χ2n?1(1?α2)≤σ2≤nS2χ2n?1(α2)}=1?α
由此可得σ2的置信水平為1?α的區間估計為
[nS2χ2n?1(1?α2),nS2χ2n?1(α2)]
##### 例題
設某種清漆的9個樣品,其干燥時間(以小時計)分別為6.0,5.7,5.8,6.5,7.0,6.3,5.6,6.1,5.0 ,
設干燥時間總體服從正態分布N(a,σ2),求σ2>0的置信
水平為0.95的置信區間。
解:
n=9,α=1?0.95=0.05,a未知
取χ2=nS2σ2~χ2(n?1)=χ2(8)
對給定的α(0<α<1),查χ2(8)表得
χ28(0.975)=2.180,χ28(0.025)=17.535
計算得ξˉ=6.0?S2=0.29
故σ2的置信度為1?α的置信區間為
[nS2χ2n?1(1?α2),nS2χ2n?1(α2)]
[9×0.2917.535,9×0.292.18]
[0.151,1.211]
因此σ2的置信區間為0.95的區間估計為[0.151,1.211]
### 二個正態總體的情形
#### 二個正態總體均值差a1?a2的區間估計
設ξ1,ξ2,…,ξn1與η1,η2,…,ηn1分別是來自正態總體N(a1,σ21)與N(a2,σ22)的子樣,且這兩個子樣相互獨立,ξˉ,ηˉ分別是這兩個子樣的均樣,s21,s22分別是這兩個子樣的方差。
因為ξˉ,ηˉ分別為a1,a2的點估計,故取ξˉ?ηˉ為a1?a2的點估計。此時ξˉ?ηˉ服從正態分布,且
E(ξˉ?ηˉ)=a1?a2D(ξˉ?ηˉ)=D(ξˉ)+D(ηˉ)=σ21n1+σ22n2
對總體方差的不同情況可得a1?a2的不同置信區間。
##### 若σ21、σ22都已知
取U=ξˉ?ηˉ?(a1?a2)σ21n1+σ22n2√~N(0,1)
對于給定的α(0<α<1),查正態分布表得uα
從而得到a1?a2置信水平為1?α的區間估計
(ξˉ?ηˉ?uασ21n1+σ22n2????????√,ξˉ?ηˉ+uασ21n1+σ22n2????????√)
##### 若σ21=σ22=σ2都未知
取T=n1n2(n1+n2?2)n1+n2??????????√ξˉ?ηˉ?(a1?a2)n1S21+n2S22√~t(n1+n2?2)
對于給定的α(0<α<1),由
P{|T|>t(n1+n2?2)(α)}=α
確認t(n1+n2?2)(α),從而得到a1?a2置信區間為1?α的區間估計是
(ξˉ?ηˉ±t(n1+n2?2)(α)n1S21+n2S22???????????√n1+n2n1n2(n1+n2?2)???????????????√)
##### 例題
為比較I, II 兩種型號子彈的槍口速度,隨機地取I 型子彈10 發, 得到槍口速度的平均值為xˉ1=500(m/s),標準差s1=1.10(m/s),隨機地取II 型子彈20 發, 得到槍口速度的平均值為xˉ2=496(m/s),標準差s2=1.20(m/s),假設兩總體都可認為近似地服從正態分布,且由生產過程可認為方差相等,求兩總體均值差a1?a2的一個置信水平為0.95的區間.
解:
由假設兩總體的方差相等, 但數值未知
故a1?a2置信度為1?α的置信區間是
(ξˉ?ηˉ±t(n1+n2?2)(α)n1S21+n2S22???????????√n1+n2n1n2(n1+n2?2)???????????????√)
n1=10,n2=20,n1+n2?2=28
α?1?0.95=0.05,t0.05(28)=2.048
t(n1+n2?2)(α)n1S21+n2S22???????????√n1+n2n1n2(n1+n2?2)???????????????√=2.048×10×1.102+20×1.202???????????????????√30200×28????????√=0.853
故a1?a2置信水平為1?α的區間估計是
(4?0.853,4+0.853)=(3.147,4.853)
#### 兩個總體方差比的置信區間
設兩正態總體N(a1,σ21)、N(a2,σ22)的參數都為未知的,子樣容量分別為n1,n2,且兩個子樣相互獨立,子樣方差分別為S21,S22,求方差比σ21/σ22的置信區間
由n1S21σ21~χ2(n1?1),n2S22σ22~χ2(n2?1)構造
F=n1S21σ21/(n1?1)n2S22σ22/(n2?1)~F(n1?1,n2?1)
對于給定的α(0<α<1),取λ1,λ2使滿足
P{λ1≤F≤λ2}=1?α

令P{F<λ1}=α/2,P{F>λ2}=α/2
即取λ1=F(n1?1,n2?1)(1?α2),λ2=F(n1?1,n2?1)(α2)
P{F(n1?1,n2?1)(1?α2)}≤(n2?1)n1S21(n1?1)n2S22.σ22σ21≤P{F(n1?1,n2?1)(α2)}=1?α
由此得σ21σ22的置信度為1?α的置信區間為
[(n2?1)n1S21(n1?1)n2S22.1F(n1?1,n2?1)(α2),(n2?1)n1S21(n1?1)n2S22.1F(n1?1,n2?1)(1?α2)]
注意如何查表得到F(n1?1,n2?1)(1?α2)
F(n1?1,n2?1)(1?α2)=1F(n2?1,n1?1)(α2)
##### 例子
研究機器A和機器B生產的鋼管的內徑,隨機抽取機器A生產的管子18只,測得樣本方差s21=0.34(mm2),抽取機器B生產的管子13只,測得樣本方差s22=0.29(mm2),設兩樣本相互獨立,且由機器A和機器B生產的鋼管的內徑分別服從正態分布N(a1,σ21),N(a2,σ22)試求方差比σ21/σ22的一個置信水平為0.90 的置信區間.
解:
現在n1=18,s21=0.34;n2=13,s22=0.29
α=0.10F(n1?1,n2?1)(α2)=F(17,12)(0.05)=2.59F(n1?1,n2?1)(α2)=F(17,12)(0.95)=1F(12,17)(0.05)=12.38
于是得σ21σ22的置信度為0.90的置信區間為
(73.4464.09×2.59,73.4464.09×12.38)=(0.44,2.73)
### 練習
假設隨機變數X~N(a,2.8),現有X的10個觀察值X1,…,X10,已知Xˉˉˉ=110∑10i=1xi=1500,
**1)求a的置信度為0.95置信區間**
解1)
由于σ2=2.82已知,故選U=Xˉ?aσ/n√~N(0,1)
由α=0.5?uα=1.96,a的置信度為0.95置信區間為
[Xˉˉˉ?uασn√,Xˉˉˉ+uασn√]=[1500?1.96×2.810??√,1500+1.96×2.810??√]=[1498.3,1501.7]
**2)要想使0.95的置信區間長度l小于1,觀察值個數n最少應去多少?**
解2)
l=(Xˉˉˉ+uασn√)?(Xˉˉˉ?uασn√)=2uασn√
要使a的置信度為0.95置信區間的長度小于1,
即
2uασn√<1?2×1.96×2.8n<1
?n>(2×1.96×2.8)2=120.47
所以觀察值個數n最少應取121
**3)如果樣本容量n=100,那么區間(Xˉˉˉ?1,Xˉˉˉ+1)作為a的區間估計,其置信度是什么?**
解3)
置信區間若為(Xˉˉˉ?1,Xˉˉˉ+1),則l=2
即有等式2uασn√=2?uα=100√2.8=3.57
P(|U|≤uα)=P(|U|≤3.57)=2Φ(3.57)?1=2×0.9998?1=0.9996
置信度為0.9996