二項定義
一個事件必然出現,就說它100%要出現。100%=1,所以100%出現的含義就是出現的機率P=1。 即必然事件的出現機率為1。若某事件機率為p,現重複試驗n次,該事件發生k次的機率為:P=C(k,n)×p^k×(1-p)^(n-k).C(k,n)表示組合數,即從n個事物中拿出k個的方法數。
舉例說明
如果擲一枚硬幣,正面向上的結局的機率為0.5 。反面向上的結局的機率也是0.5 。那么出現正面向上事件或者反面向上事件的機率就是0.5+0.5=1 ,即二者必居其一。如果擲兩次硬幣,根據獨立事件的機率乘法定理那么兩次都是正面(反面)向上的機率是0.5×0.5=0.25。另外第一個是正第二個是反的出現機率也是 0.5×0.5=0.25。同理第一個反第二個正的出現機率也是0.5×0.5=0.25。於是一正一反的機率是前面兩個情況的和,即 0.25+0.25=2×0.25=0.5 。它們的合計值仍然是1。
兩個正面的機率 | 一正一反的機率 | 兩個反面的機率 |
0.25 | 2×0.25=0.5 | 0.25 |
代數計算
注意到代數學中 (a+b)^2=a^2+2ab+b^2, 而在a=0.5,b=0.5時,有 1^2=(0.5+0.5)^2=0.25+2×0.5×0.5+0.25=1。這說明擲兩次硬幣的各個結局的出現機率可以通過對二項式的平方展開而得到。順此,對於擲n次硬幣的各種結局的出現機率也可以通過對二項式的n次方的展開而得到。例如n=3時,有(注意0.5×0.5×0.5=0.125) 1^3=(0.5+0.5)^3=0.125+3×0.125+3×0.125+0.125 = 0.125+0.375+0.375+0.125 = 1。
3個正面的機率 | 2正1反的機率 | 1正2反的機率 | 3個反面的機率 |
0.125 | 0.375 | 0.375 | 0.125 |
牛頓公式
二項式展開的牛頓公式表示為:(a+b)^n=a^n + … + [n!/m!(n-m)!][a^(n-m)b^m]+ … + b^n (其中m=1,2,……n-1)。
即這種類型的問題(如擲多次硬幣)的機率分布恰好可以用二項式展開的牛頓公式表示。而這也就是為什麼把這種機率分布類型稱為二項分布的原因。
如果a,b並不等於0.5,那么只要把A事件出現的機率以p代入,把B事件的出現機率以(1-p)代入,以上公式仍然正確,(a+b仍然=1)。所以對於僅有A,B兩個結局的隨機事件,如果A事件出現機率為p,B事件的出現機率為1-p,那么在n次隨機實驗中A事件出現n-m次、B事件出現m次的情況(對應一種複合事件)的出現機率P應當是(這裡的P是大寫的):
P=[n!/m!(n-m)!][p^(n-m) (1-p)^m] (其中m=0,1,……,n)
注意到上面公式的對稱性,它也可以寫為 P=[n!/m!(n-m)!][p^m (1-p)^(n-m)]。它就是所謂二項分布概型的隨機事件的出現機率公式,也是牛頓二項式展開在變數為對應機率值的情況下的通項。
二項分布
若某事件機率為p,現重複試驗n次,該事件發生k次的機率為:P=C(k,n)×p^k×(1-p)^(n-k).C(k,n)表示組合數,即從n個事物中拿出k個的方法數.二項分布概念
在醫學領域中,有一些隨機事件是只具有兩種互斥結果的離散型隨機事件,稱為二項分類變數(dichotomous variable),如對病人治療結果的有效與無效,某種化驗結果的陽性與陰性,接觸某傳染源的感染與未感染等。二項分布(binomial distribution)就是對這類只具有兩種互斥結果的離散型隨機事件的規律性進行描述的一種機率分布。考慮只有兩種可能結果的隨機試驗,當成功的機率(π)是恆定的,且各次試驗相互獨立,這種試驗在統計學上稱為貝努里試驗(Bernoulli trial)。如果進行n次貝努里試驗,取得成功次數為X(X=0,1,…,n)的機率可用下面的二項分布機率公式來描述:
(7.1)
式中的n為獨立的貝努里試驗次數,π為成功的機率,(1-π)為失敗的機率,X為在n次貝努里試驗中出現成功的次數,表示在n次試驗中出現X的各種組合情況,在此稱為二項係數(binomial coefficient)。
所以的含義為:含量為n的樣本中,恰好有例陽性數的機率。
含量為n的樣本中,發生各種陽性數的機率正好為下列二項式展開的各項
(7.2)
式中,π為總體陽性率;n為樣本含量;X為陽性數;(nX)為組合數,即二項式展開後各項的係數。
二項分布套用條件
1.各觀察單位只能具有相互對立的一種結果,如陽性或陰性,生存或死亡等,屬於兩分類資料。2.已知發生某一結果(陽性)的機率為π,其對立結果的機率為1-π,實際工作中要求π是從大量觀察中獲得比較穩定的數值。
3.n次試驗在相同條件下進行,且各個觀察單位的觀察結果相互獨立,即每個觀察單位的觀察結果不會影響到其他觀察單位的結果。如要求疾病無傳染性、無家族性等。
二項分布性質
1.二項分布的均數和標準差在二項分布資料中,當π和n已知時,它的均數μ及其標準差σ可由式(7.3)和(7.4)算出。μ=nπ(7.3)
σ=(7.4)
若均數和標準差不用絕對數表示,而是用率表示時,即對式(7.3)和(7.4)分別除以n,得
μp=π(7.5)
σp=(7.6)
σp是樣本率的標準誤的理論值,當π未知時,常用樣本率p作為π的估計值,式(7.6)變為:
sp= (7.7)
2.二項分布的累計機率(cumulative probability)常用的有左側累計和右側累計兩種方法。從陽性率為π的總體中隨機抽取含量為n的樣本,則
(1)最多有k例陽性的機率
(7.8)
(2)最少有k例陽性的機率
(7.9)
其中,X=0,1,2,…,k,…,n。
3.二項分布的圖形已知π和n,就能按公式計算X=0,1,…,n時的P(X)值。以X為橫坐標,以P(X)為縱坐標作圖,即可繪出二項分布的圖形,如圖7.1,給出了p=0.5和 p=0.3時不同n值對應的二項分布圖。
二項分布的形狀取決於π和n的大小,高峰在m=np處。當p接近0.5時,圖形是對稱的;p離0.5愈遠,對稱性愈差,但隨著n的增大,分布趨於對稱。當n→∞時,只要p不太靠近0或1,特別是當nP和n(1-P)都大於5時,二項分布近似於常態分配。
π=0.5時,不同n值對應的二項分布
π=0.3時, 不同n值對應的二項分布
兩點分布的分布列就是
X 0 1
P p 1-p
不論題目有什麼區別,只有兩種可能,要么是這種結果要么是那種結果,通俗點,要么成功要么失敗
而二項分布的可能結果是不確定的甚至是沒有盡頭的,
列一個二項分布的分布列就是
X 0 1 2 ……… n
P C(0)(n)·(1-p)^n C(1)(n)·p·(1-p)^(n-1) …… C(n)(n)·p^n·(1-p)^0
也就是說當n=1時,這個特殊二項分布就會變成兩點分布,
即兩點分布是一種特殊的二項分布
像一樓說的二項分布是兩點分布的多重實驗也不無道理,因為兩者都是獨立的重複實驗,只不過次數不同罷了
E(n) = np, var(n) = np(1-p) (n是實驗次數,p是每次實驗的機率)
盤點高中數學名詞
高中是大學的過渡階段,學好高中數學,才能為學好大學數學打好基礎,那我們盤點下高中數學中有哪些名詞吧。 |