信息過濾系統

信息過濾系統對網站信息發布、公眾信息公開申請和網站留言等模組內容實現提交時的自動過濾處理,發現有謾罵、誹謗、等非法言論和問句進行實現自動過濾,並給用戶友好的提示,同時向管理員提交報告。從而大大提高了審核速度和效率。

數據抽取
系統開始工作後,按照抽取策略定時抽取指定數據源中要過濾的數據對象,系統管理員可以設定多種不同的監控數據源以及數據抽取的頻率,自定義工作只需一次做完後抽取工作就會自動進行,以後也無需再設定,除非是修改它。
文本處理
此模組負責將特殊的檔案內容進行處理操作,真對具有HTML內容的文本去除html標籤,抽出有用的文本,生成以空格為分隔的純文本內容。去除標籤的文本內容是我們分析的來源。
自動過濾
系統將根據文本處理過後的內容進行自動過濾,它能夠有效識別和過濾各種非法文本信息。根據既定的語義範式和過濾詞表進行自動對比,在其中發現有害信息。
審核數據
工作人員對過濾後的結果進行人工校驗,人工校驗後方可進行數據發布處理。
配置管理
此模組為系統管理員配置數據抽取策略及系統其它需要配置參數的模組。
詞表和語義範式維護
分詞詞典維護:可真對本行業專業詞進行增加、刪除和修改操作,以便信息過濾更加準確。
過濾詞表維護:有害文本關鍵字和其它需要過濾的詞表維護。
語義範式維護:系統管理為自動過濾設定語義範式和範式策略的維護。
統計報告
系統根據過濾結果生成過濾情況的統計報告,可生成柱狀圖、餅狀圖和條狀圖,以統計圖表和二維表格的形式展現,以便分析系統運行狀況和用戶使用狀況。
基於語義網的信息資源過濾
眾所周知,今天網上的內容和信息都是設計給人閱讀的,而不是讓計算機“閱讀”的。語義網是一個能夠理解人類語言的智慧型網路,可識別信息的意義,並對信息自動進行解釋、交換和處理。本產品的中文語義匹配是語義範式和語義矩陣建立的智慧型文本分析系統,它可篩選出其使用者所需要的信息,並自動將這些信息傳送到不同的存儲位置中去。

相關詞條

熱門詞條

聯絡我們