索引庫的分類方式
索引庫里用詞語來分類。因為儘管網際網路上的網頁是不斷激增的,但是每一種語言裡,詞語的數量都是相對固定的。比如英語就是一百多萬個單詞,100億 ÷ 1百萬 = 1 萬;漢語是8萬多個詞語,100億÷8萬=12萬5千。都是計算機很容易處理得過來的。
用詞語來分類還有一個好處,就是可以匹配用戶查詢的那個詞語。本來用戶就是要查這個詞語的,那我就按這個詞語去分類就是。所以,搜尋引擎的索引庫,最後就是這個樣子的:
索引庫就類似於我們查字典時候的檢索表,或者是圖書館的書目檢索。Google的蜘蛛在抓取網頁之後,就把這些頁面放到對應的索引庫裡面。在用戶搜尋的時候,只需要到相應的檢索庫裡面搜尋相應的信息,而不是從所有的頁面當中。
索引庫里用詞語來分類。因為儘管網際網路上的網頁是不斷激增的,但是每一種語言裡,詞語的數量都是相對固定的。比如英語就是一百多萬個單詞,100億 ÷ 1百萬 = 1 萬;漢語是8萬多個詞語,100億÷8萬=12萬5千。都是計算機很容易處理得過來的。
用詞語來分類還有一個好處,就是可以匹配用戶查詢的那個詞語。本來用戶就是要查這個詞語的,那我就按這個詞語去分類就是。所以,搜尋引擎的索引庫,最後就是這個樣子的:
主要收錄以事系人和傳、錄、表中出現的人名,不含政治術語中作定語的人名 ,以人名命名的地名、事物、事件、建築物、紀念場所,帝王紀年、照片說明詞、引文和附 ...
人名索引在計算機科學中,分形樹索引是一種樹數據結構,他保持數據排序,並允許在與B樹相同的時間內進行搜尋和順序存取,但插入和刪除的速度比B樹快。像B樹一樣,分形樹...
概述 索引比較 索引操作 實現檔案存放位置索引是檔案館為指明庫房內檔案存放情況而編制的圖表。
檔案存放位置索引 正文 配圖 相關連線Boost庫是為C++語言標準庫提供擴展的一些C++程式庫的總稱,由Boost社區組織開發、維護。Boost庫可以與C++標準庫完美共同工作,並且為其提...
基本介紹 分類《全國報刊索引》月刊,前身是1951年4月由山東省圖書館編印的《全國主要資料索引》。1955年3月改由上海圖書館編輯出版,1956年更名為《全國主要報刊...
簡介 收錄 產品介紹 貢獻索引資料庫是信息整理、分類、索引產生的庫。
夠快雲庫是由上海夠快網路科技股份有限公司, 在2013年12月18日發布的檔案存儲、協作雲服務平台。與傳統網盤相比,夠快雲庫為用戶提供了無限雲存儲空間,...
簡介 功能及特點 特色服務 新三板掛牌發布會 夠快雲公益計畫, 中國現代當代詩人年表, 中國現代當代詩人索引, 中國現代詩歌作品彙編...文檔參考資料 * 中國詩歌庫 http://www.shigeku.com...