t分配與χ2卡方分配與Z分配的關係-排列組合機率76－銘記星辰之下

t分配與卡方分配與Z分配的關係

還記得標準常態分度的Z的定義=Z=x￣－μ / σ/ √n 。還記得前面幾篇所講的漂準誤差的Z值嗎?
當符合足夠抽樣比時，這樣就可以使用標準常態分布方式來計算偏倚信賴區間：即Z{0.025}=1.96，EXECL=NORM.S.DIST(Z,1)=NORM.S.DIST(1.96,1)=0.975002，雙邊誤差為(1-0.975=0.025)X2=0.05 (即±5%)。
偏倚區間=x￣(標準差)±(σx￣(標準誤差X Z值)
此符合足夠抽樣比時取樣n項，其樣本平均值有95%偏倚信賴區間會落在：標準差±(標準誤差X1.96)的範圍內。

再往前追到二項分配：
二項分配的數學式：E(X)=np=μ ，Var(x)=np(1-p)= N Σ i=1 σN^2
常態分布的時候σ因為正負∞，所以Var(x)=σ^2決定了x軸分布的大小。
不過如果考慮的是單邊機率問題從－∞到x的值ｚ= P(x-μ / σ)，如果考慮的是雙邊機率問題－∞～X～＋∞，σ（標準差）因為會變成σ^2（變異數），所以在計算z時ｚ= P(x-μ / σ^(1/2))。

變異數分析的基本原理
單批平均數偏倚機率：數個母體平均數間的差異，如果差異夠大，大於統計上的隨機差異，便可能獲得顯著的檢定假設的結果。
多批平均數變異偏倚機率：多批母體平均數間的差異的檢定，多批平均數間的變異數，大於統計上的隨機差異，便可能獲得顯著的檢定假設的結果。

接著又深入一點，有個叫var(x)=用符號表示σ^2 /n(整個±∞曲線)，然後再看單邊機率分布曲線又有σx￣=σ/√n。
接著又深入一點，隨機變量Xij與總平均數的偏差的平方和，是所得全部多批數據的離散程度，偏差平方和中包含各總體之間，所抽取的某數據的差異，如果能把偏差平方和中的這兩部分信息分解出來並對其進行比較，就可以大概追尋到隨機因素造成的試驗誤差就，可以達到檢驗假設是否證真或證假的目的。

單批平均數偏倚機率：F(χ) = [ 1 / (σ(2 π)^1/2) ] exp{ -1[(χ-μ)^2] / 2σ^2}，
Ф(u) = [ 1 / (σ(2 π)^1/2) ] exp{ -1[( u )^2] / 2σ^2}。
u=χ-μ/σ，μ=0，σ=1，u=χ-0/1，u=χ。X→-∞∫X+∞ Ф(u) d(u)。

而多批則參考後擴展成X～N(μ,σ^2/n)，F(χ; μ, σ/√n)，
在對變異數判斷時，多了/ n或是/ √n，實務上，當我們無法確認群體分配數學函數曲線時，只要樣本數夠大，一般為30以上時，就算是多批樣本不同的機率分布為偏左、偏右分佈，仍在微觀處、部分處可視為與群體常態分布相同之常態分佈，
雖群體常態分佈之Z = x￣－μ / σ/√n 未能確認，但可以以樣本標準差代替 σ，會令Z=x￣－μ / S / √n ，
此時會符合常態分佈下自由度為n-1的t分配，記為Z=x￣－μ / S / √n ∽ t(n-1)。

Z的定義=Z=x￣－μ / σ/ √n 。
t的定義=t=x￣－μ / S/ √n 。上下同除σ/ √n
x￣－μ / σ/ √n = S/ √n / σ/ √n。分子=x￣－μ / σ/ √n =Z。分母=S /σ。
Z / S /σ。分母S /σ之上下在同乘於^2及同乘於(n-1)再開方，使與原式相等。
Z / [ S^2 * (n-1) /σ^2 * (n-1)] ^1/2。其中的：(n-1)s^2/σ^2是服從n-1個自由度的卡方分佈。
最後得出t分配與卡方分配與Z分配的關係式為：t = Z / [ χ2 / (n-1) ]^1/2