概念
網路過濾(Network filtering)是指在網際網路骨幹上實現過濾的功能。
網際網路骨幹的主要任務是在保證可連通性的同時,儘可能快速地提供數據交換通道,這就要求網路結構和配置儘可能簡單。屬於網路高層套用的內容過濾本來不應該在網際網路骨幹上部署實施,但是,出於國家安全的需要,對一些網站還是需要進行禁止。電信運營商在網際網路骨幹上使用的內容過濾技術主要是DNS過濾和IP位址過濾。網際網路骨幹DNS伺服器拒絕解析指定URL列表,通過ACL拒絕到指定IP位址的連線。這些手段會輕微地影響網際網路性能,但是技術在現實中還是可以實現和接受的。
另外,現在中國有些地區的寬頻運營商還提供“綠色上網”服務,為申請此項服務的用戶提供內容過濾的功能,以保護青少年和兒童。這些“綠色上網”服務的原理同以上的內容過濾原理是一樣的,不同之處在於每個用戶的可定製化功能。還有些運營商採取了“投訴”的方式來維護更新不良內容網址,通過獎勵上網費用和時間的方式來鼓勵寬頻用戶投訴不良網路,同樣這也是一個很好的思路和現實的做法。
技術難點和技術趨勢
從以上過濾手段來看,它們都受制於內容分類的效率和準確性。如何提高內容分類的效率和準確性,是各個廠商鑽研的難題。
實際上,每個月都有超過100萬個新註冊的網站出現在網際網路上,也就是說網際網路是變化的,這種變化是永不停息的。我們不可能把所有的網站和網頁都進行歸類並放在資料庫當中,這樣的話,這個資料庫的規模將會遠遠超過實際套用中硬體平台性能所能承受的最大限制。那么最好的辦法還是挑選一部分網站放在資料庫當中,這些網站至少具有兩個特徵:訪問量比較大和包含不良內容。對於那些訪問量不大,或者內容“不鹹不淡”的網站,大可以忽略不計。
在變化之外,每個企業或者每個人的瀏覽習慣都是不一樣的,也可能有些人特別喜歡瀏覽一些冷門的網站,這就涉及一個個性化的問題。為了對這些訪問進行控制和過濾,內容過濾產品本身還要具有一定的智慧型,能夠自動分析歸類這些網站的內容,並對用戶的訪問進行過濾。這樣的分析結果應該保留在訪問者的本地內容過濾設備上,而不是上傳同步到所有的用戶。這樣的話,所有用戶就有一個集中的公共資料庫,包含了絕大部分熱門網站,每個用戶還有一個分散的私人資料庫,包含了自己的瀏覽分析歸類數據。