排列組合與機率計算(十二) 二項分佈與超幾何分配與Excel函數應用總結

 

 

排列組合 - 好用工具箱

 

Deepseek

 

首先,用戶解釋了二項概率的基本公式:

n次獨立試驗中,事件發生r次的概率是C(n,r) * p^r * (1-p)^(n-r)

這裡p是單次試驗成功的概率,C(n,r)是組合數。

 

用戶用擲5顆骰子,出現6點的概率作為例子,計算了從05次出現6點的概率,結果之和為1,這說明計算正確。

 

然後,用戶提到Excel中的BINOM.DIST.RANGE函數,並舉例說明。

 

例如,BINOM.DIST.RANGE(10,0.1,2,6)計算的是在10次試驗中,成功次數在26次之間的概率,結果為0.263892

 

而另一個例子BINOM.DIST.RANGE(10,0.1,3)則等同於BINOM.DIST(3,10,0.1,0),也就是剛好3次成功的概率,結果是約0.057396

 

. BINOM.DIST.RANGE 函數解析

語法與參數

excel

=BINOM.DIST.RANGE(trials, probability_s, number_s, [number_s2])

 

trials:總試驗次數(如 10 次)。

probability_s:每次試驗成功的機率(如 0.1)。

number_s:成功次數的「下限」。

[number_s2](可選):成功次數的「上限」。若省略,則計算 恰好等於下限 的機率。

 

. 案例計算與手動驗證

案例一:範圍機率(2 X 6

公式 =BINOM.DIST.RANGE(10, 0.1, 2, 6) 計算 10 次試驗中成功 2 6 次 的機率。

 

手動計算步驟:

逐項計算

P(X=r)=C(10,r)(0.1)^r(0.9)^10r

其中 r=2,3,4,5,6

1.    P(X=2)=450.1^20.9^80.1937

2.    P(X=3)=1200.1^30.9^70.0574

3.    P(X=4)=2100.1^40.9^60.0112

4.    P(X=5)=2520.1^50.9^50.0015

5.    P(X=6)=2100.1^60.9^40.0001.

 

總和:

0.1937+0.0574+0.0112+0.0015+0.00010.2639

Excel 結果一致。

 

案例二:單次機率(X = 3

公式 =BINOM.DIST.RANGE(10, 0.1, 3) 省略上限參數,等同計算 恰好成功 3 次 的機率。

手動計算:

P(X=3)=C(10,3)0.1^30.9^7=1200.0010.47829690.0574.

  Excel  BINOM.DIST(3,10,0.1,FALSE) 結果一致。

 

3. 函數對比:BINOM.DIST vs BINOM.DIST.RANGE

BINOM.DIST用途:計算單點或累積機率。參數特點:cumulative 控制是否累加。範例結果:0.0574

BINOM.DIST.RANGE用途:計算區間或單點機率。參數特點:可指定上下限或僅下限。範例結果:0.2639

 

 

4. 應用場景與注意事項

區間機率需求:

若需計算 範圍內機率(如 2~6 次),使用 BINOM.DIST.RANGE 更高效,避免逐項計算再手動加總。

範例:品質檢驗中,判斷不良品數落在「可接受範圍」的機率。

 

單點機率需求:

若只需計算 恰好某次數 的機率,兩函數等價,但 BINOM.DIST 參數更直觀。

「恰好成功3次」的意思是:

在固定次數的獨立試驗中,成功次數「正好等於3次」的機率,且其他次數均為失敗。 

這在統計學中屬於 單點機率(精確機率)的計算。以下透過生活化案例與公式解析,逐步說明其意義與應用:


概念解析:什麼是「恰好成功3次」?

舉例說明:

假設你拋一枚 不公平硬幣,正面朝上的機率是 0.110%),反面是 0.990%)。
問題:若拋硬幣 10,「恰好出現3次正面」的機率是多少?
答案

  • 這就是計算 10次試驗中,成功(正面)3 的機率,且其餘7次均為失敗(反面)。
  • 此機率即為 二項分配 的單點機率。

數學公式與手動計算

二項分配公式

P(X=r)=[C(n,r)p^r][(1p)^nr]

 

  • 參數意義

o    n=10:試驗總次數。

o    r=3:成功次數。

o    p=0.1:單次成功的機率。

o    1p=0.9:單次失敗的機率。

o    C(n,r):組合數,計算從10次中選出3次成功的方式數。

 

 

手動計算步驟

計算組合數C(10,3)=(10!) / [3!(103)!] =120

計算成功次數的機率0.1^3=0.001

計算失敗次數的機率0.9^(103)=0.9^70.4782969

相乘得最終機率P(X=3)=1200.0010.47829690.057396

 


Excel 函數驗證

使用 BINOM.DIST 函數

excel

=BINOM.DIST(3,10,0.1,FALSE)  // 結果  0.057396
  • 參數解析
    • 3:成功次數(恰好3次)。
    • 10:總試驗次數。
    • 0.1:單次成功機率。
    • FALSE:計算「單點機率」(非累積)。

使用 BINOM.DIST.RANGE 函數

excel

=BINOM.DIST.RANGE(10,0.1,3)    // 結果 0.057396

省略上限參數時,預設計算 恰好等於下限(3次) 的機率,等同於 BINOM.DIST(3,10,0.1,FALSE)

 


 

.常見誤區與注意事項

誤區一:混淆「恰好」與「至少」或「至多」

  • 「恰好3次」:只計算成功 正好3,排除2次或4次。
  • 「至多3次」:計算成功 0+1+2+3 的累積機率(需設定 cumulative = TRUE)。
  • 「至少3次」:計算成功 3+4+…+10 的機率(需用 1 - 累積至2次的機率)。

誤區二:忽略試驗的獨立性

  • 二項分配假設 每次試驗獨立(如:拋硬幣結果不影響下一次)。
  • 若試驗間有依賴性(如:從有限群體中無放回抽樣),需改用 超幾何分配

 

.實際應用場景

品質管制案例

某工廠生產燈泡,不良率為 1%p=0.01)。

問題:隨機抽檢 100 燈泡,「恰好有3個不良品」的機率是多少?
計算

P(X=3)=C(100,3)0.01^30.99^970.0613

此機率可協助判斷抽檢結果是否符合預期,或是否需調整生產流程。

 


6. 總結:關鍵概念圖示

概念

數學表示

Excel 函數

應用場景

恰好成功

P(X=r)

 

 

BINOM.DIST(r,n,p,FALSE)

精確判斷單一事件發生機率

範圍機率

P(aXb)

 

 

BINOM.DIST.RANGE(n,p,a,b)

風險評估或品質控管範圍


 

透過以上分析,「恰好成功3次」即為精確計算某一特定成功次數的機率,是二項分配的核心應用之一。

掌握此概念後,可進一步延伸至累積機率、區間機率與假設檢定等進階分析。

 

參數輸入陷阱:

下限 > 上限:Excel 會返回 #NUM! 錯誤。

非整數次數:參數必須為整數,否則自動截斷取整。

 

5. 進階驗證:數值穩定性分析

極端值測試:

當成功機率極低(如 p=0.001)時,高成功次數的機率趨近於 0BINOM.DIST.RANGE 仍能穩定計算。

例如:=BINOM.DIST.RANGE(1000,0.001,5,10) 可快速計算罕見事件的區間機率。

 

總結

BINOM.DIST.RANGE 適用於快速計算二項分佈的 區間機率,簡化手動累加步驟。

單點機率可選用 BINOM.DIST 或省略上限的 BINOM.DIST.RANGE,兩者結果一致。

實際應用中,需注意參數合理性(如上下限範圍、整數限制),並透過手動驗證確保計算正確性。

 


 

接下來,用戶比較了二項分佈和超幾何分佈的區別:

 

二項分佈是每次試驗後放回(即獨立事件),而超幾何分佈是不放回的。這部分需要確認是否正確。

是的,超幾何分佈通常用於無放回抽樣,而二項分佈適用於有放回或總體很大近似獨立的情況。

 

用戶還討論了一個例子,

X是三次試驗的總成功次數時,各個成功次數的概率計算方式。

 

這裡可能需要更清晰的解釋。

例如,對於0個成功的情況,使用者提到3C0 * p^0 * (1-p)^3,這部分是對的,

 

然後,用戶給出另一個例子:

產品不良率為0.1,抽檢10個,剛好3個不良品的概率是BINOM.DIST(3,10,0.1,0)得到的0.057395628

並解釋了累積參數為TRUE時,計算的是從0到指定次數的累積概率。

 

例如,在擲5顆骰子的例子中,出現16點的概率計算為5C1*(1/6)^1*(5/6)^4,得到的結果是0.401878,和出現0次的結果相同。

5C0*(1/6)^0*(5/6)^5 = 1*1*(5/6)^5 (5/6)^5 0.401877572,四捨五入到小數點後六位是0.401878,正確。

5C1*(1/6)^1*(5/6)^4 = 5*(1/6)*(5/6)^4 5*(1/6)*(625/1296) 5*(625/7776) 3125/7776 0.401877572,同樣得到0.401878

 

接下來出現的其他結果,例如出現2次的是0.160751,是否計算正確?計算5C2*(1/6)^2*(5/6)^3

5C2 = 10,所以10*(1/6)^2*(5/6)^3 = 10*(1/36)*(125/216) = 10*(125)/(36*216) 1250/(7776) 0.160751028,正確。

 

BINOM.DIST.RANGE(10,0.1,2,6)中的參數依次是試驗次數n=10,成功概率p=0.1,下限2,上限6,返回的是成功次數在26之間的概率總和。

使用者給出的結果是0.263892。

 

手動計算的話,這個概率應該是從r=2r=6的各個概率之和。

即Σ(C(10,r)*0.1^r*0.9^(10-r))從r=26

這個計算可能比較繁瑣,但可以用Excel函數來驗證。

 

另外,當只給出一個參數時,如BINOM.DIST.RANGE(10,0.1,3),是否返回的是恰好3次的概率?

根據使用者所述,確實如此,結果和BINOM.DIST(3,10,0.1,0)相同,約0.057396

這說明BINOM.DIST.RANGE在只有一個參數時,視為下限和上限相同,即恰好該次數的概率。

 

關於用戶對二項分佈和超幾何分佈的區分是否正確?

是的,用戶正確指出了兩者的區別在於抽樣是否放回。

不過可能需要更明確的說明,超幾何分佈適用於有限總體且不放回的情況,而二項分佈適用於無限總體或放回的情況。

 

在用戶討論的X=X1+X2+X3的例子中,Xi01,總共有三次試驗,每個試驗的成功概率是p

 

例如,用戶提到“01的機率:3C0=1(證真組合的可能性) X 證真機率^證真幾種 + 3C3=1(證假組合的可能性) X 證假機率^證假幾種”。正確的公式是C(3,0)*p^0*(1-p)^3

正確的計算應該是每個成功次數r的組合數為C(n,r),然後乘以p^r*(1-p)^(nr),用戶似乎將成功和失敗的組合拆開解決延伸的問題。

 

例如,使用者提到的“證真組合的可能性”和“證假組合的可能性”可能是想分開計算,但實際上它們是同一個組合數的兩部分,

C(n,r) = C(n, nr),但公式中的指數部分應該分別對應成功次數和失敗次數。

 

所以使用者在這裡可能需要更準確的表達,例如,C(n,r)是選擇r次成功的位置的方式數,然後乘以p^r(成功的概率)和(1p)^{nr}(失敗的概率)。

 

最後,用戶給出的例子中,計算BINOM.DIST(3,10,0.1,0)得到0.057395628,而累積到3次的結果是各個概率之和,用戶用BINOM.DIST(3,10,0.1,1)得到0.987204802

 

但根據實際計算,BINOM.DIST(3,10,0.1,1)應該是累積到3次的概率,即r=03的和。用戶給出的數值是否正確?

 

計算各次數的概率:

r=0: C(10,0)*0.1^0*0.9^10 0.3486784401

r=1: C(10,1)*0.1^1*0.9^9 10*0.1*0.387420489 0.387420489

r=2: C(10,2)*0.1^2*0.9^8 45*0.01*0.43046721 45*0.0043046721 0.1937102445

r=3: C(10,3)*0.1^3*0.9^7 120*0.001*0.4782969 120*0.0004782969 0.057395628

 

將這些相加:0.3486784401 + 0.387420489 0.7360989291 + 0.1937102445 0.9298091736 + 0.057395628 0.9872048016

所以用戶的結果正確,即BINOM.DIST(3,10,0.1,1)0.987204802

 

以下是關於二項分配的詳細說明及Excel函數應用總結:

二項分配基本概念

n次獨立試驗 中,某事件發生 r次 的機率公式為:

P(X=r)=C(n,r)p^r(1p)^nr

 C(n, r):組合數,表示從n次試驗中選出r次成功的方式數。

p:單次試驗成功的機率。

(1-p):單次試驗失敗的機率。

 

擲骰子範例驗證

投擲5顆骰子,計算出現k6點(不良製程)的機率(p=1/6 ):

.出現06點:

C(5,0)(1/6)^0(5/6)^5=11(5/6)^50.401878

.出現16點:

C(5,1)(1/6)^1(5/6)^4)=51/6(5/6)^40.401878

.同理可計算其他次數,總和為1,驗證公式正確性。

 

Excel函數應用

BINOM.DIST函數:

語法:BINOM.DIST(number_s, trials, probability_s, cumulative)

 

參數:

number_s:成功次數。

trials:總試驗次數。

probability_s:單次成功機率。

cumulativeTRUE(累積機率, number_s);FALSE(精確機率,= number_s)。

 

範例:

不良率0.1,抽驗10次中恰好3次不良:

=BINOM.DIST(3, 10, 0.1, FALSE)0.057396

 

累積至3次不良(3次):

=BINOM.DIST(3, 10, 0.1, TRUE)0.987205

 

BINOM.DIST.RANGE函數:

 

語法:BINOM.DIST.RANGE(trials, probability_s, number_s, [number_s2])

 

功能:計算範圍內的成功機率(含上下限)。

 

範例:

10次試驗中成功26次的機率:

=BINOM.DIST.RANGE(10, 0.1, 2, 6)0.263892

 

若省略上限,則計算恰好指定次數(等同BINOM.DIST):

=BINOM.DIST.RANGE(10, 0.1, 3)0.057396

 

二項分配 vs. 超幾何分配

二項分配:適用於有放回或無限總體(每次試驗獨立,機率固定)。

 

超幾何分配:適用於無放回抽樣(機率隨抽樣改變)。

 

常見誤區釐清

組合數對稱性:

C(n,r)=C(n,nr),但需注意機率中的指數次方(如成功r次需搭配失敗nr次)。

 

P(X=r)=C(n,r)p^r (1p)^nr

 

累積機率計算:使用cumulative = TRUE時,結果為從0到指定次數的總和。

 

總結

二項分配用於獨立試驗的機率計算,Excel函數可快速處理複雜運算。

確保正確區分精確機率(FALSE)與累積機率(TRUE)的應用場景。

 

超幾何分配適用於有限總體無放回情境,與二項分配互補。

透過以上整理,可更清晰掌握二項分配的核心概念與實務操作技巧。

 

回顧超幾何分佈的定義:

它適用於不放回的抽樣,每次試驗後樣本總體會減少,因此每次試驗的概率會變化。

而二項分佈是有放回的抽樣,每次試驗獨立,概率不變。

這點非常重要,必須明確區分兩者的應用場景。

 

接下來,需要給出超幾何分佈的公式,並解釋各個參數的含義。

例如,公式中的N(總體大小)、K(成功元素數量)、n(抽取的樣本數量)、k(樣本中的成功次數)。同時,對比二項分佈的公式,強調超幾何分佈沒有獨立性,因為不放回。

 

然後,需要提供具體的例子,比如從牌堆中抽牌,品質檢測中的抽樣等,來說明超幾何分佈的應用。

同時,用Excel函數HYPGEOM.DIST來演示如何計算概率,包括精確概率和累積概率,類似於之前二項分佈的示例。

 

此外,用戶之前提到了BINOM.DIST.RANGE函數,但超幾何分佈在Excel中是否有類似的函數呢?

根據我的知識,Excel中的HYPGEOM.DIST函數主要用於計算精確值或累積概率,但沒有直接的RANGE函數。

可能需要使用累積概率的參數設置來模擬範圍計算,或者通過多次調用HYPGEOM.DIST並相加。

這點需要明確說明,避免使用者混淆。

 

還需要注意使用者可能存在的誤區,例如在樣本量較大時,超幾何分佈和二項分佈的結果可能接近,但前提是樣本量相對於總體非常小。

這時候需要提醒使用者注意兩者的適用條件,避免錯誤應用。

 

最後,總結超幾何分佈與二項分佈的關鍵區別,幫助用戶在實際問題中選擇正確的模型。

同時,強調Excel函數的參數設置和實際應用中的注意事項,比如參數輸入順序、累積與精確模式的區別等。

 

在整理這些內容時,要保持結構清晰,分點說明,便於用戶理解和查閱。

可能需要使用公式展示、示例計算和Excel函數語法說明,確保使用者能夠逐步跟隨並應用所學知識到實際問題中。

 

超幾何分配基本概念:

超幾何分配用於描述在 有限總體不放回抽樣 中,成功事件發生的機率分佈。適用於以下情境:

 

總體數量固定(如:一箱產品、一副撲克牌)。

每次抽樣不放回,導致每次抽樣的成功機率改變。

關注 特定成功次數 在抽樣中的機率。

 

超幾何分配公式:

若總體大小為 N,其中有 K 個「成功元素」,從中抽取 n 個樣本,則恰好抽到 k 個成功元素的機率為:

P(X=k)= C(K,k)C(NK,nk)/C(N,n)

C(a,b):組合數,表示從 a 個元素中選取 b 個的方式數。

適用條件:max(0,n+KN)kmin(K,n)

 

與二項分配的關鍵區別:

Excel函數應用:HYPGEOM.DIST

函數語法:

excel

=HYPGEOM.DIST(sample_s, number_sample, population_s, population_size, cumulative)

 

參數說明:

sample_s:樣本中的成功次數 k

number_sample:抽取的樣本數 n

population_s:總體中的成功元素數 K

population_size:總體大小 N

cumulativeTRUE(累積機率, k);FALSE(精確機率,= k)。

 

範例說明:

情境:一箱 50 個產品中有 5 個不良品,隨機抽取 10 個,求恰好 2個不良品的機率。

=HYPGEOM.DIST(2, 10, 5, 50, FALSE)0.2105

 

累積機率(2個不良品):

=HYPGEOM.DIST(2, 10, 5, 50, TRUE)0.9522

 

產品品質檢驗:

總體 N=100 個產品,已知不良品 K=10 個。

隨機抽檢

n=20 個,計算抽到 k=3 個不良品的機率:

P(X=3)= C(10,3)C(90,17)/C(100,20) 0.198

Excel公式:=HYPGEOM.DIST(3,20,10,100,FALSE)

 

 

撲克牌遊戲:

一副牌 N=52 張,其中紅心 K=13 張。

n=5 張,求至少 2 張紅心的機率(使用累積機率):

P(X2)=1P(X1)=1HYPGEOM.DIST(1,5,13,52,TRUE)0.588

 

超幾何分配的近似與極限

N 極大且 nN,超幾何分配近似二項分配:

P(X=k)C(n,k)( K/N )^k (1 K/N )^nk

 實務應用:若總體大小為樣本量的 20 倍以上,可簡化使用二項分配計算。

 

常見誤區與注意事項:

參數輸入順序:

Excel HYPGEOM.DIST 參數順序易混淆,需嚴格對照:

sample_s, number_sample, population_s, population_size

 

範圍計算限制:

Excel 無直接計算區間機率的函數(類似 BINOM.DIST.RANGE),需手動加總:

例:計算 k=2 k=4 的機率:

k from 2 to 4 HYPGEOM.DIST(k, n, K, N, FALSE)

總體與樣本限制:

n>N K>N,公式無意義,Excel 將返回錯誤。

 

總結

超幾何分配適用於 小總體不放回抽樣,其機率依賴總體與樣本的組合關係。

Excel HYPGEOM.DIST 可快速計算精確或累積機率,但需注意參數順序與適用條件。

實際應用中,當總體遠大於樣本量時,可近似使用二項分配簡化計算。

透過對比二項與超幾何分配,可更精準選擇模型解決實際問題。

 

​​​​​​​===

arrow
arrow
    創作者介紹
    創作者 銘記星辰之下 的頭像
    銘記星辰之下

    銘記星辰之下

    銘記星辰之下 發表在 痞客邦 留言(0) 人氣()