當研究并解決一個實際問題時, 我們會
遇到下面問題:
? 1. 這個隨機現象可以用什么樣的分布律
來刻劃,這種分布律的選用合理嗎?
? 2. 所選用的這一分布律的參數是多少?
如何估計和確定這些參數?
如何利用數據資料,作出盡可能精確可
靠的統計結論(統計推斷):
1) **估計**——從局部觀測資料的統計特征,推斷總體的特征(分布與矩);
2)**假設檢驗**——依據抽樣數據資料,對總體的某種假設作檢驗,從而決定對此假定是拒絕抑或接受.
### 數理統計的基本概念
**總體**:研究對象全體; 也稱母體, 記作S.
**樣本**:總體中抽出作觀測的個體;也稱子樣,記ω
**樣本容量**:抽取的個體數目;也稱樣本大小.
### 例子
隨機抽5支,得壽命數據(稱為觀察[測]值):
725,520,683,992,742.(小時)
一般記為,x1?x2?x3?x4?x5.
又抽5支, x′1?x′2?x′3?x′4?x′5.
再抽5支, x′′1?x′′2?x′′3?x′′4?x′′5?.
…… ……
如此繼續. 各組觀察值彼此不同.
如此繼續. 每組中的第一支燈的壽命,
也彼此不同. 這樣,泛指所抽取的第一支熒光燈的壽命應是一個rv,記為
X1 . 同樣第二支的壽命是rv?X2 ,…
如此得一組rv?:?X1,X2,X3,X4,X5
稱為大小為5的樣本.
一般地則有大小(容量)為n 的樣本,稱x1,x2,...,xn為**樣本觀察值**[*現實*].
抽取的樣本如能切實保證其隨機性,那么應該彼此獨立,且能反映總體的隨機規律性,即所有樣本彼此獨立且與總體同分布.
這樣的樣本,我們稱之為**簡單樣本**. 這種抽樣方法,叫**簡單抽樣**.
注意,在有限總體中,各觀察結果可能不獨立.
### 樣本的數字特征與分布
最簡單又方便的樣本函數g(X1,…,Xn)是Xi們的一次和二次的線性組合.
由于樣本“平等”,線性組合中應有相等的權系數.
**一次時:**樣本的算術平均值Xˉˉˉ;
**二次時:**中心化后的樣本二階中心矩S2n.
設X1,…,Xn為總體S的大小為n的樣本, 分別稱
Xˉˉˉ=1n∑i=1nXi????S2=1n?1∑i=1n(Xi?Xˉˉˉ)2
為
**樣本均值**
和
樣本方差[(樣本方差除以n-1的原因)](http://www.dutor.net/index.php/2009/10/sample-variance/)
,而依次稱
Mk=1n∑i=1nXki????S2n=1n∑i=1n(Xi?Xˉˉˉ)2
為
**樣本的k階矩**
和
**樣本的二階中心矩**
.
記號:**總體k階矩**:
μk=EXk∫+∞?∞xkdFX(x)
**總體的k階中心矩**
:
σk=∫+∞?∞(x?EX)kdFX(x)
μ=μ1,σ2=σ2
.
注意
1)M1=Xˉˉˉ,S2n沒叫樣本方差.
2) 比較總體的期望μ、方差σ2與矩μk:
1. 樣本的均值、方差及k階矩等都是rv,并且因n有限而總是存在的.
2. 總體的期望、方差及k階矩等不一定存在.且即便存在,也是實數值, 而非rv.
3.代入觀察值, 有相應的**樣本矩的觀察值**x,m以及s2 等.
性質 如果總體k階矩存在,則樣本的k階矩的數學期望等于總體的k階矩,而當n趨于無窮時,樣本的k階矩以概率收斂到總體的k階矩,即

### 順序統計量與經驗df
仍從觀察值出發設法求總體分布. 以五支熒光燈壽命數據725,520,683,992,742為例,構造

其df 函數(如后圖)稱為**經驗df函數**.
設{xi}觀察值重新依序排列為{x(n)}:????x(1)≤x(2)≤?≤xn
令
稱為由{xi}決定的**經驗df**, 簡記為F?n(x).
將以從小到大為序重新排列的一個樣本,稱為**順序統計量**,專記為x(1)?x(2)?…?xn
下面一個非常重要的定理確立經驗df 的重要地位. 此定理保證,幾乎由每一組觀察值得到的經驗df,只要n足夠大,都可作為總體df的近似. 定理中一致收斂性和幾乎處處收斂性,給了我們充分的自由.從而由樣本去找總體df,理論上有一個完滿的解決.
limn→∞F?n(x)=F(x)
### 抽樣分布與統計量
#### 正態總體常用的樣本函數
1.設總體S~N(μ,σ2). 則
樣本均值Xˉˉˉ~N(μ,σ2n),從而
Z:=Xˉˉˉ?μσ/n√~N(0,1)
2.K2n:=∑n1(Xi?μσ)2的分布χ2(n)
K2n是n個獨立的標準正態變量的平方和,稱n個獨立的標準正態變量的平方和的分布為自由度為n的[χ2分布](http://baike.baidu.com/link?url=Nu_ktFPjY7pDAtSiJt5IXx6pOjijIZhxJp1RvQ1yFDskdSmu1gnhk6QLk9JRPZqXIorAfySMJqg2yQCo4Fo_mq).
3.(n?1)S2σ2~χ2(n?1)
樣本均值與樣本方差獨立, 且
K2=(n?1)S2σ2=∑1n(Xi?Xˉˉˉσ)2 ~ χ2(n?1)
在K2n=∑n1(Xi?μσ)2中用Xˉˉˉ易μ得K2.
4.T:=Xˉ?μS/n√~ t(n?1)
Z:=Xˉ?μσ/n√~N(0,1)中如σ未知,S2是σ2的無偏估計,自然用S代替Z中的σ引入T
如果Z ~N(0,1),Y~χ2(n)且獨立,則稱
t=ZY/N????√~t(n)
即自由度n的[t分布](http://baike.baidu.com/link?url=scKS9Aozzu4_3ydPC18Kg4S5jrD4nkyvensgS2exsIZW-SgpuEXxDOw64SgbKV3UjdE3CNKH7bvVqfcMxD_jfq).
5.Fnm:=S21σ22S22σ21~F(n?1,m?1)
如果X~χ2(n),Y~χ2(n),且兩者相互獨立,則稱F=χ2(n)/nχ2(m)/m~F(n,m)
為自由度為n,m的[F分布](http://baike.baidu.com/view/1173064.htm)
#### 性質
? t 分布是對稱的,且n→∞極限為正態(n≥30時近似的效果就很好) .
? t 分布只有k<n階矩.
? κ2分布和F分布不對稱,且x<0 時為0.
? κ2 分布的可加性:設U 與V 獨立,且分別~κ2(n)和κ2(m),則U+V~κ2(n+m).
對給定的實數α∈(0,0.5), 使
P(X>y)=∫∞yfX(x)=α
成立的點y, 稱為X 或其分布的上百分位α點. 特別對N(0,1)、t(n)、κ2(n)和F(n,m)分布, 分別記為
zα,tα(n),χ2α(n),Fα(n,m)
使
P(X>y)=∫∞yfX(x)=1?α
成立的點y, 稱為X 或其分布的下百分位α點. 特別對N(0,1)、t(n)、κ2(n)和F(n,m)分布, 分別記為
z1?α,t1?α(n),χ21?α(n),F1?α(n,m)
百分位點的值,可由表查得.
#### 例題:
##### 例題1:
設X1,X2,…,Xn, 是來自總體X~N(0,σ2)的簡單隨機樣本,求統計量
∑10i=1(?1)iXi∑20i=11X2i????????√
的分布。
解:
由題意可知Xk~N(0,σ2)可得
∑10i=1(?1)iXi~N(0,10σ2)
∑10i=1(?1)iXi?/10??√σ~N(0,1)
又因為∑20i=11(X2iσ)~χ2(10)
故由t分布定義可得
∑10i=1(?1)iXi∑20i=11X2i????????√?=?∑10i=1(?1)iXi10??√σ(∑20i=11(X2i/10)σ)?1~t(10)
##### 例題2:
設X1,X2,…,Xn+1是正態總體的簡單樣本,前面容量為n的樣本均值和樣本二階中心矩分別為Xˉˉˉ 和S2n
試求下列樣本函數的分布
1)(n?1)(X1?μ)2?/?∑ni=2(Xi?μ)2
2)Xn+1?XˉSnn?1n+1???√
解:
1)
(n?1)(X1?μ)2?/?∑ni=2(Xi?μ)2=(Xi?μ)2σ2∑ni=2(Xi?μσ)2n?1
分子服從χ2(1),分母服從χ2(n?1)
所以整個式子服從F(1,n?1)
2)
Xn+1?XˉSnn?1n+1???√
分母部分變成:
S2n(n?1)σ2~χ2(n?1)
分子部分變成:
Xn+1?Xˉσ~N(0,1)
因此原式變成:
Xn+1?XˉσS2n(n?1)σ2√?/?n?1√
服從t(n?1)