“冒煙指數”作用
冒煙指數能夠對P2P網貸平台的風險進行及時預警,為有關部門採取打擊行動提供了依據。
構建冒煙指數預警雲平台需要強大的數據中心。在北京市各部門的協助下,包括網際網路、公檢法、工商稅務以及一切公開的信息,開始匯集到這個大數據監測預警非法集資平台上。
用“冒煙指數”來衡量網貸平台的危害程度,主要通過收益率偏離度、投訴率、傳播虛假性、機構合規度、疑似非法性五個維度進行判斷。對冒煙指數超過60分的平台,相關部門要列入重點監管,超過80分的,政法機關就要及時啟動打擊處置程式。
“冒煙指數”是基於網際網路數據和跨部門數據,構建針對五大領域十七個行業的分析模型,利用大數據計算動態監測的非法集資相關指數。其機制類似於實驗主義治理領域的關鍵風險點控制(HACCP),根據非法集資的四個特性構建出合規性、收益率偏離等五個維度的特徵性指數,並從大數據分析中梳理出關鍵風險點,比如關聯風險即為監測重點。這種機制的突出優勢在於:一是降低對現場檢查、匯報數據的依賴,變被動監管為主動監測,破解地方監管與開放主體的張力難題;二是預警監測有效前置,可根據“冒煙指數”的程度採取關注、警示、約談等監管措施,既防患於未然,又使得監管措施更加多樣化、柔性化,大幅提升監管效率。
“冒煙指數”平台總體原理
大數據監測預警非法集資平台,從海量的網際網路信息中提取涉及非法集資的相關信息,大數據中心7x24 小時對企業數據、政府數據新聞、輿情數據等進行動態監測。通過對大數據中心多個數據源的數據,在記憶體式計算系統上進行分散式計算,經過數據清洗、數據集成、數據變換、數據規約等一系列預處理過程,把數據集合統一轉換成可供分析的結構化數據。
大數據監測預警非法集資平台在綜合利用上述跨部門數據資源的基礎上,以大數據和雲計算為技術支撐,利用機器學習和神經網路技術,構建“冒煙指數”分析模型,從海量數據中篩選出與企業非法集資風險高度相關的幾類指標,構建“冒煙指數”模型。
“冒煙指數”分數越高,該企業非法集資風險就越高。
大數據監測預警非法集資平台包括金融風險大數據管理系統和金融風險大數據分析挖掘系統,分別對數據進行管理和存儲,對接其他政府部門的不同數據並對數據進行分析和挖掘。
非法集資分析模型子系統主要包含系統所需要的計算模型,包含主動發現模型、全面排查模型、網貸行業風險分析模型、投資理財風險分析模型、私募模型、預警模型等;監測預警子系統是通過數據採集和加工並通過模型計算後最終通過量化指標“冒煙指數”來展示企業的風險,通過金融風險分析方法,構築金融風險防控體系。
金融風險分析大數據中心為大數據監測預警非法集資平台提供數據支撐,從海量的網際網路信息中7x24小時不間斷提取企業的非法集資相關信息,圍繞非法集資的監測預警,建設金融風險大數據中心,每日數據量更新達5000萬條。
輿情數據採集站點超過2萬個、新聞數據12.08億條、論壇8.6億條、微博163.1億條、微信公眾號數據2.96億條;工商數據覆蓋4500萬家企業和1億家工商個體戶;法院數據15億條、採集站點超過3800個、覆蓋1000萬家涉訴企業;招聘數據覆蓋主流招聘網站;投訴數據對接了“12345”熱線、“打擊非法集資”公眾號、信箱等渠道;金融行業數據覆蓋了網貸、私募、眾籌、小額貸款公司、交易中心、融資租賃等行業。
此外,該大數據中心還採集了ICP備案數據,同時建立了一套非法集資高風險企業庫。
推出“冒煙指數”
北京地區“打擊非法集資監測預警平台”的特點在於其推出“冒煙指數”。
“冒煙指數”的最初構想來源於“森林開始冒煙是要發生火災”,通過煙與火的形象比擬來推斷“冒煙指數”與非法集資企業的關係,即從集資類企業冒煙指數高低來判斷其從事非法集資類業務的傾向性。
目前,國外已經把監管科技成功地套用在大量量化業務、信息業務、風險識別,形成了一系列敏捷實用的管理工具,如立法/監管差距分析、合規性、健康檢查、活動監控、風險數據倉庫、風險報告自動化生成等。
北京在建設“打擊非法集資監測預警平台”中借鑑國際經驗也推出了“冒煙指數。其“冒煙指數”模型是在利用金融風險分析大數據中心數據的基礎上,以大數據和雲計算為技術支撐,從海量數據中篩選出與企業非法集資風險高度相關的幾類指標,構建針對5大領域17個行業的分析模型。主要從合規性指數、收益率偏離指數、投訴舉報指數、傳播力指數、特徵詞命中指數共5個維度的多項數據對監控對象計算分析,利用不同的機器學習方法,經過訓練後建立起風險預警模型,最終得出的非法集資風險相關度指數,即“冒煙指數”。
根據“冒煙指數”的得分來進行分級預警,分數越高,則該企業非法集資風險就越高。如果指數為80—100區間,則應向公安部門移交線索;指數為60—80區間,則意味著其非法集資的風險非常高,需要重點關注、約談整改;指數為40—60區間,則需要監管部門重點監測、規勸改正。
“冒煙指數”可實現大數據重塑金融監管流程:通過爬蟲技術收集監測企業公開的網際網路數據信息,基於海量大數據風險信息,憑藉機器學習、知識圖譜、自然語言處理、雲計算等技術,通過兩次非法集資風險點比對、一次人工專家干預等一系列步驟,得出綜合風險評分。也就是說通過大數據挖掘的手段對研究範圍內的企業進行及時有效的綜合風險篩查與預測,並為監管機構提供差異性處理策略的依據。
“冒煙指數”的突出優勢在於:一是降低對現場檢查、匯報數據的依賴,變被動監管為主動監測,破解地方監管與開放主體的難題;二是預警監測有效前置,可根據“冒煙指數”的程度採取關注、警示、約談等監管措施來防患於未然,提高監管措施前瞻性、及時性。
“冒煙指數”的成效
非法集資監測預警平台作為金融風險監管平台的一部分,可以憑藉在大數據打擊非法集資風險監測預警方面積累的業務知識和實踐,以技術驅動監管創新為理念,落實建設全國性網際網路金融風險監測預警雲平台,對金融風險進行全覆蓋、全行業的常態化監測預警。以滿足市場需求和解決現實問題為導向,運用大數據分析和數據挖掘技術實時處理與網際網路金融風險相關的信息,以達到金融風險常態化監測預警的目的,屬於金融科技的套用方向之一。
大數據監測預警非法集資平台已被北京市金融工作局運用到了2015年和2016年北京市打擊非法集資專項整治行動中,並取得了顯著的成效。
截至2016年底,承建該平台的拓爾思公司向北京市金融工作局提供各類監測報告共500餘份,監測北京市各類企業3000多家,分布於全市16個區,報送了50餘家高非法集資風險的企業。大大提高了北京市金融局防範、處置、化解非法集資的工作效率,降低了非法集資的案發數量和處置成本。
在2016年北京市網際網路金融風險專項整治行動中,大數據監測預警非法集資平台協助北京金融局排查了近17萬家網際網路金融機構的運營風險,為有關部門採取相應措施提供了有力依據。
目前,“冒煙指數”作為利用大數據監測預警非法集資平台的核心技術,以及打擊防範非法集資犯罪域內比較權威的評判標準,已經亮相於各大主流媒體並被多本專業書籍套用。