跳至內容

離散型均勻分布

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書
離散型均勻分布
機率質量函數
Discrete uniform probability mass function for n=5
n=5 where n=b-a+1
累積分布函數
Discrete uniform cumulative mass function for n=5
母數

值域
機率質量函數
累積分布函數
期望值
中位數
眾數 N/A
變異數
偏度
峰度
動差母函數
特徵函數

統計學機率理論中,離散型均勻分布是一種離散型機率分布,其所有可能的觀察值數量為有限整數,且每一個觀察值的出現機率皆相同。

離散型均勻分布的一個例子是擲公平骰子,其可能的觀察值為1﹑2﹑3﹑4﹑5﹑6,而每一個數字的出現機率都是1/6。但若同時丟二個均勻骰子,將其值相加,就不屬於離散型均勻分布,因為各個和的機率不同。

雖然離散型均勻分布常用來描述觀察值為連續整數的分布,例如前述的擲骰子範例,但實際上可以在任意有限集合上定義離散型均勻分布,例如隨機置換英語random permutation就是由已知長度的置換中均勻隨機產生的組合,而均勻生成樹英語uniform spanning tree則是從給定的生成樹集合中均勻隨機抽樣得到的生成樹

離散型均勻分布在本質上是無母數(non-parametric)的。不過,當觀察值的範圍恰好是區間[a,b]之間的整數時,則a和b可以被視為該分布的母數(也常常改為考慮區間[1,n],只保留一個母數n)。若用這種表示法,針對任意k ∈ [a,b]的累積分布函數(CDF)為

最大值估計

[編輯]

關於離散型均勻分布的一個常見問題是德國坦克問題:假設從未知整數區間抽樣出個觀察值,目標是根據觀察值估計未知最大值的可能值。此問題於二戰期間被用於估計德國坦克產量。

在此問題中,最大值的均勻最小變異數不偏 (UMVU) 估計量為:

其中 m 是樣本最大值,k 是樣本大小,而且無放回抽樣。 這可被看作為最大間距估計的一個非常簡單的例子。

該估計量的變異數為:

因此,估計量的標準差大約為,也就是樣本之間差距的平均大小。

樣本最大值是母體最大值的最大概似估計,然而,該方法存在偏差。

若樣本沒有依序編號但可被識別或標記,則可透過標誌重捕法以估計族群規模。

隨機排列

[編輯]

有關均勻分布隨機排列的固定點數量的機率分布的說明,請參閱主條目。