中國網際網路信息監測預警系統

中國網際網路信息監測預警系統

中國網際網路信息監測預警系統是中網安(北京)信息技術研究院在深入分析和深刻理解用戶需求的基礎上,以採用oracle主流技術的先進性,以用戶體驗為理念的設計細化功能的實用性,以數據集成與整合為核心的綜合套用開發的創新性的總體設計路線,實現的輿情挖掘系統產品化。

開發團隊

研究院簡介:

中網安(北京)信息技術研究院(原中國網路安全信息技術研究院)現已成為國內大型的以大數據,雲計算為主導的高新技術單位。

中網安(北京)信息技術研究院自成立以來,始終堅持依託自主研發的擁有獨立智慧財產權的網路輿情信息監測平台,為各企事業單位提供專業的輿情信息監測等服務,幫助政府發現重大、敏感事件,並進行正確的輿論引導,提高政府執政能力,協助企業精準掌握市場行情,監測競爭對手動態,牢牢把握商機,維持企業健康良好的形象,在我國經濟不斷發展的今天立於不敗之地。

頂級的技術和服務團隊:

中網安(北京)信息技術研究院具備獲得中國信息產業部頒發的中國計算機軟體專業系統分析員水平證書的專業開發人員,承擔信息部信息搜尋分析資源共享服務平台建設項目,承擔多項國家科技製成計畫等科研項目,得到國家創新基金的支持,致力於863計畫,國家科技支撐計畫等課題的成果轉化.

主要功能

輿情信息採集

中國網際網路信息監測預警系統對於人工定義的18萬重點站點中的新聞、論壇、部落格等實現全面的抓取,同時支持對主流新聞網站分頁、評論內容的採集以及對論壇點擊數、回帖數、回帖內容的抓取。自動跟蹤多個搜尋引擎的搜尋結果,對於系統抓取進行補充,確保信息全面無遺漏。
除系統常規監測範圍外,還可以自定義需要重點監測的信息,用戶可以設定採集的欄目、URL、更新時間、掃描間隔等,以便及時發現目標信息源的最新變化,並以最快的速度將個性化關注內容採集到本地。

信息處理

a、文本信息分類
包括分詞、分類建模、文本分類、詞典管理和類別管理等功能
b、概念空間管理
包括文本聚類和語義索引等功能
c、信息抽取
包括輿情文摘的生成等功能
d、專題建立
包括輿情專題生成。專題組織和管理等功能

信息檢索

a、目錄瀏覽
系統的目錄是通過分類和聚類技術自動生成的,分類和聚類算法的有效性保證了目錄瀏覽的可行性
b、語義檢索
通過概念語義關聯分析建立概念語義索引有效解決了關鍵字不匹配造成的檢索不到結果的問題,同時還建立了在檢索結果中限制主題領域的擇類檢索機制,提高了查準率
c、專題檢索
用戶只需給出專題相關的一個或者幾個關鍵字就可以方便實現對專題的檢索,然後系統會給出專題檢索的參數設定界面,系統根據用戶輸入參數返回用戶需要的個性化結果
d、圖文聯合查詢
系統根據WEB外部語義信息和圖像低層視覺信息進行圖像檢索,它通過挖掘模組獲取相關輿情圖像後,再本地經過語義和圖像視覺信息處理。系統的圖文檢索也是建立在概念語義空間之上的,所以檢索結果不僅返回圖像結果,而且給出關聯語義概念聯想。

技術支撐

文本相似度分析技術

文本相似度的計算是挖據過程的一個重要方面。本系統的文本分類過程是將文本根據其所描述的話題進行分類,也就是根據兩段文本的相似度來判斷兩段文本是否描述同一個類別,並且判斷出他們描述的是怎樣的話題,從而分析得出其是否是用戶所需主題。文本相似度的計算有多種方式:其中常用的是基於向量空問模型的和基於集合的計算方法。

CSP算法及在系統中的套用

基於餘弦相似度分析的CSP算法是根據連結到網頁的主題的相關性的高低來傳遞PageRank值,使得網際網路中PageRank值向主題相近的網頁上傳遞,改善整個網際網路的PageRank值分布,這樣就可以使較多的、令用戶滿意的、有效的網頁出現在整個排序結果集的靠前位置,就容易被用戶查詢到,提高查詢的質量。

正則表達式技術及在系統中的套用

正則表達式提供了強大、靈活而又高效的方法來處理文本。正則表達式的全面模式匹配表示法可以快速地分析大量文本以找到特定的字元模式;提取、編輯、替換或刪除文本字元串;或將提取的字元串添加到稽核以生成報告。

產品優勢

產品特點:

*對預定義的不良信息或違法事件實時監測預警回響速度在分鐘以內
*對未定義的不良信息或違法事件發現在5分鐘以內
*對社區或重點人物分析系統處理與回響速度在3分鐘以內
*具備分秒級實時監測與預警功能,滿足網路輿情監測的實時性要求
*系統存儲模型基於大規模分散式文式系統
*程式設計模式採用計算找數據模式,支持MapReduce並行化
*通信模式基於訊息中間件、計算節點間全異步通信,並具有良好的兼容性
*計算模型採用全局算法的分布化實現全局數據的弱一致性
*服務部署模型底部支持雲環境,並支持虛擬機布置

產品的獨特之處:

*對視頻,音頻內容以及其它輿情信息的挖掘
系統應能同時支持基於內容的圖像和視頻片段檢索,用戶可以通過關鍵字或範例進行查詢。同時,集成低層次特徵和語義信息相關反饋功能,可以自動學習用戶的查詢意圖,提高檢索的語義準確率。此外系統還集成大規模高維數據度的索引算法,可以管理大規模的圖像視頻庫數據。
*對大量惡意輿情垃圾的識別
當網路輿情安全項目逐步為世人所矚目時,隨之而來的必然有不法分子的挑釁。他們可能會出於某種目的而惡意製造輿情垃圾,通過無內容或者虛假內容的輿情垃圾來分散有關監管部門的注意力,消耗監管部門的資源。中國網際網路信息監測預警系統保證了在及時獲取有效輿情信息的同時不會在惡意輿情垃圾上消耗過多的資源,有效的遏制輿情垃圾的傳播。
*對非國區域網路頁的監測
有資料顯示,大量惡意輿情信息的發起源和傳播途徑都並非我國網頁,這些網頁多半是某些別有用心的組織或個人策劃的。中國網際網路信息監測預警系統則通過設定正負值的方法有效的對這個惡意信息進行實時監測,並能達到及時預警的作用。

相關詞條

熱門詞條

聯絡我們