概念
Poisson分布更多地專用於研究單位時間、單位人群、單位空間內,某罕見事件發生次數的分布。如某種細菌在單位容積空氣或水中出現的情況,某段時間特定人群中某種惡性腫瘤患者的分布或出生缺陷的發病情況,放射性物質在單位時間內的放射次數,單位空間某種昆蟲數的分布等等。
Poisson分布在π很小,樣本含量n趨向於無窮大時,二項分布的極限形式。當試驗中成功事件出現的機率很小,如π<0.05,試驗的次數n很大`時,用二項分布計算成功事件出現的次數X(X=0,1,2,…, n)的機率很困難,用Poisson分布可簡化計算。Poisson分布發展成為描述小機率事件出現規律性的一種重要的離散型分布。
Poisson分布的機率函式
X=1,2,3…(7.13)意義:單位時間(單位人群、單位空間內,單位容積)內,某罕見事件發生次數的機率分布
式中μ=nπ為Poisson分布的總體均數,總體中沒單位中的平均陽性數,X為單位時間或單位空間內某事件的發生數(陽性數),e為自然對數的底,約等於2.71828。
性質
1.Poisson分布是一種單參數的離散型分布,其參數為μ,它表示單位時間或空間內某事件平均發生的次數,又稱強度參數。2.Poisson分布的方差σ2與均數μ相等,即σ2=μ
3.Poisson分布是非對稱性的,在μ不大時呈偏態分布,隨著μ的增大,迅速接近常態分配。一般來說,當μ=20時,可以認為近似常態分配,Poisson分布資料可按常態分配處理。
4.Poisson分布的累計機率常用的有左側累計和右側累計兩種。單位時間或空間內事件發生的次數
最多為k次的機率 :(X= 0,1,2,…)
最少為k次的機率 :(X= 0,1,2,…)
5.Poisson分布的圖形已知μ,就可按公式計算得出X= 0,1,2,…時的P(X)值,以X為橫坐標,以P(X)為縱坐標作圖,即可繪出Poisson分布的圖形,如圖7.2。
Poisson分布的形狀取決於μ的大小。μ值越小,分布越偏,隨著μ的增大,分布越趨於對稱,當μ=20時,分布接近常態分配,當μ=50時,可以認為Poisson分布呈常態分配N(μ, μ),按常態分配處理。
6.Poisson分布是二項分布的極限形式二項分布中,當π很小而n很大,nπ→μ時,二項分布趨於Poisson分布。
7. Poisson分布的觀察結果有可加性。若從總體均數為的Poisson分布總體中隨機抽出一份樣本,其中稀有事件的發生次數為X1,再獨立地從總體均數為的Poisson分布總體中隨機抽出另一份樣本,其中稀有事件的發生次數為X2,則它們的合計發生數T()也服從Poisson分布,總體均數為。
上述性質還可以推廣到多個Poisson分布的情形。例如,從同一水源獨立地取水樣5次,進行細菌培養,每次水樣中的菌落數分別為,,均服從Poisson分布,分別記為,那么把5份水樣混合,其合計菌落數也服從Poisson分布,記為。醫學研究中常利用其可加性,將小的觀察單位合併,來增大發生次數X,以便用後面講到的正態近似法作統計推斷。
套用條件
Poisson分布的套用條件與二項分布相同,即要求事件的發生是相互獨立的,發生的機率相等,結果是二分類的。Poisson分布主要用於研究單位時間或單位空間內某事件的發生數,理論上單位時間或單位空間內的發生數可為無窮大。而用於研究單位人群中某疾病發生數的分布時,單位人群的人數要求大一些,比如以1000人或更多作為單位人群,某些發病率極低的疾病要求更多。