Bootstrapping算法

Bootstrapping算法

Bootstrapping算法,指的就是利用有限的樣本資料經由多次重複抽樣,重新建立起足以代表母體樣本分布的新樣本。bootstrapping的運用基於很多統計學假設,因此假設的成立與否會影響採樣的準確性。

統計學中,bootstrapping可以指依賴於重置隨機抽樣的一切試驗。bootstrapping可以用於計算樣本估計的準確性。對於一個採樣,我們只能計算出某個統計量(例如均值)的一個取值,無法知道均值統計量的分布情況。但是通過自助法(自舉法)我們可以模擬出均值統計量的近似分布。有了分布很多事情就可以做了(比如說有你推出的結果來進而推測實際總體的情況)。

bootstrapping方法的實現很簡單,假設抽取的樣本大小為n:

在原樣本中有放回的抽樣,抽取n次。每抽一次形成一個新的樣本,重複操作,形成很多新樣本,通過這些樣本就可以計算出樣本的一個分布。新樣本的數量通常是1000-10000。如果計算成本很小,或者對精度要求比較高,就增加新樣本的數量。

優點:簡單易於操作。

缺點:bootstrapping的運用基於很多統計學假設,因此假設的成立與否會影響採樣的準確性。

相關詞條

相關搜尋

熱門詞條

聯絡我們