Logistic分布

Logistic分布

Logistic分布指當n趨向於無窮大時，從指數分布(exponential distribution)中抽取的容量n的隨機樣本的最大與最小樣本值的平均的極限分布。密度函式為：f(x)=exp[-(x-α)/β]/β1+exp[-(x-α)/β]，-∞

基本介紹

定義一

Logistic分布

如果一個隨機變數，它的分布函式為

Logistic分布

Logistic分布

則稱服從 logistic分布，這個分布函式叫做 logistic函式，其圖形見圖1，此曲線叫做 logistic曲線。其密度函式為

Logistic分布

圖1a logistic分布函式

圖1b logistic密度函式

Logistic分布

Logistic分布

Logistic分布

Logistic分布

由圖可見的期望值，密度函式對對稱。分布函式F(x)在處等於005。(0，0，5)為曲線F(x)的對稱點，而F(x)=0及F(x)=1為其漸近線。在(0，0，5)點處F(x)的斜率m=0.25。這是logistic函式的最簡單的形式。

定義二

Logistic分布函式為

Logistic分布

的分布稱為 Logistic分布 。

Logistic分布

其中。

Logistic分布

式也可寫成

Logistic分布

它的密度函式為

Logistic分布

Logistic分布

Logistic分布

Logistic分布

Logistic分布

Logistic分布

Logistic分布

式還告訴我們，Logistic分布仍然是屬於位置-尺度參數族，其中是位置參數。是尺度參數，這樣凡與位置-尺度參數族有關的結果，均對Logistic分布有效。當時，相應的分布稱為標準Logistic分布，它的分布函式與分布密度為

Logistic分布

很明顯，如考慮

Logistic分布

Logistic分布

則也是一個分布函式，且有關係式

Logistic分布

Logistic分布

因此有時上也從出發，以它作為標準分布，經隨機變數線性變換後導出的分布作為一般的Logistic分布。

一元logistic函式

一般地，一元logistic函式可表為

Logistic分布

Logistic分布

Logistic分布

Logistic分布

式中為二常值參數，隨取值不同，分布的期望值，以及對稱點，及對稱點處的斜率取值也不同，從而可形成一些不同的S形曲線；因此可依式(2)擬合某些S形曲線。不過此式中y的值域總是區間(0，1)，且以y=0及y=1為其漸近線。

多元logistic函式

更一般的logistic函式為多元的(設為m元)

Logistic分布

Logistic分布

Logistic分布

Logistic分布

Logistic分布

Logistic分布

Logistic分布

其中皆為m+1維向量，為參數向量，，到則分別為變數所可取的值，這些變數可以是連續的也可以是離散的。這個函式在不同條件下，或經不同的變換，可套用於不同的統計分析問題。

Logistic分布

在研究來自同一總體的兩個變數(設為X和Y)間的關係時，採得容量為n的樣本。畫出這組數據的散點圖，如曲線接近S形，可試用logistic曲線去擬合它。

Logistic回歸模型

模型概念

Logistic回歸模型是分析二分類型變數時常用的非線性統計模型，是最重要且套用最廣泛的非線性模型之一。該模型的因變數為二分類變數(y=0或y=1)，結果變數與自變數間是非線性關係。形式如方程(1)：

Logistic分布

Logistic分布

指事件發生的機率，取0～1 。

模型優缺點

優點：

第一，對變數要求低，可以接受非常態分配的數據；

第二，總體預測準確率較高；

第三，數據來源直接，操作簡便；

第四，判斷標準明確；

第五，模型穩定，利於推廣創新。

缺點：

第一，大多數時候對ST企業預測準確率較低；

第二，P值臨界點的選擇影響模型預測結果；

第三，違約樣本與正常樣本的比例影響預測結果。

模型原理

Logistic分布

模型構造的原理簡單來說是運用對數運算將事件發生與否(即事件發生機率或1)與自變數x間的非線性關係轉化為線性關係。以單一自變數為例，具體轉化步驟如下：

第一步，將上述Logistic模型方程(1)轉化為如下一個非線性方程(2)。

Logistic分布

第二步，方程(2)化簡轉化為如下方程(3)。

Logistic分布

第三步，方程(3)等式兩邊同時取對數轉化為如下方程(4)。

Logistic分布

Logistic分布

模型(4)得出與x間的線性關係方程。

Logistic分布

Logistic分布

Logistic分布

此時，與雖然不存線上性關係，但是關於P的函式記作logistic(P)與存線上性關係。同理，自變數可拓展為m個，則有如下模型方程(5)。

Logistic分布

Logistic分布

以上得到的模型同樣可以用來預測事件的發生。預測時根據已知自變數與模型方程得出，可以進一步計算事件發生的機率P。P處於0與1之間，越接近1表示發生的機率越大。

模型基本假設

第一，數據必須來自隨機樣本；

Logistic分布

Logistic分布

第二，為m個自變數的函式；

Logistic分布

第三，或1；

第四，自變數不需要呈常態分配。

模型套用步驟

第一步，選取樣本、確定初始指標；

第二步，篩選指標；

運用SPSS軟體對所有指標進行Kolmogorov-Smirnov常態分配檢驗。符合常態分配的指標進行顯著性T檢驗，不符合常態分配的數據進行Mann-Whitney顯著性檢驗，去除不顯著指標。進行Pearson檢驗，去除與其他指標存在高度相關性的指標。進行多重共線性檢驗，去除與其他指標存在多重共線性的指標；

第三步，進行KMO檢驗，確定是否進行因子分析；

第四步，進行Logistic回歸，得到模型，觀察模型擬合程度及預測準確率；

第五步，用檢驗樣本檢驗模型預測能力；

第六步，利用模型預測事件的發生機率。

模型參數解釋

Logistic分布

Logistic分布

Logistic分布

當參數b大於0時，自變數x增大，減小，增大；

Logistic分布

Logistic分布

當參數b小於0時，自變數x增大，增大，減小；

Logistic分布

Logistic分布

當參數b等於0時，自變數x增加對無影響，不變。

因此，模型參量係數可以反映自變數x與事件發生機率P的關係。係數為正表明自變數x的增長促進事件的發生，係數為負表明自變數x的增長抑制事件的發生。

相關詞條

相關搜尋

熱門詞條

聯絡我們