簡介
國家知識基礎設施(National Knowledge Infrastructure,CNKI)的概念,由世界銀行提出於1998年。CNKI工程是以實現全社會知識資源傳播共享與增值利用為目標的信息化建設項目,由清華大學、清華同方發起,始建於1999年6月。在黨和國家領導以及教育部、中宣部、科技部、新聞出版總署、國家著作權局、國家計委的大力支持下,在全國學術界、教育界、出版界、圖書情報界等社會各界的密切配合和清華大學的直接領導下,CNKI工程集團經過多年努力,採用自主開發並具有國際領先水平的數字圖書館技術,建成了世界上全文信息量規模最大的"CNKI數字圖書館",並正式啟動建設《中國知識資源總庫》及CNKI格線資源共享平台,通過產業化運作,為全社會知識資源高效共享提供最豐富的知識信息資源和最有效的知識傳播與數位化學習平台。CNKI工程的具體目標,一是大規模集成整合知識信息資源,整體提高資源的綜合和增值利用價值;二是建設知識資源網際網路傳播擴散與增值服務平台,為全社會提供資源共享、數位化學習、知識創新信息化條件;三是建設知識資源的深度開發利用平台,為社會各方面提供知識管理與知識服務的信息化手段;四是為知識資源生產出版部門創造網際網路出版發行的市場環境與商業機制,大力促進文化出版事業、產業的現代化建設與跨越式發展。分類系統
以學科分類為基礎,兼顧用戶對文獻的使用習慣,將資料庫中的文獻分為十個專輯,每個專輯下分為若干個專題,總計168個專題。中文網站
CNKI是全球信息量最大、最具價值的中文網站。據統計,CNKI網站的內容數量大於目前全世界所有中文網頁內容的數量總和,可謂世界第一中文網。CNKI的信息內容是經過深度加工、編輯、整合、以資料庫形式進行有序管理的,內容有明確的來源、出處,內容可信可靠,比如期刊雜誌、報紙、博士碩士論文、會議論文、圖書、專利等等。因此,CNKI的內容有極高的文獻收藏價值和使用價值,可以作為學術研究、科學決策的依據。網際網路平台
CNKI是一個網際網路出版平台。未來學家預測,在不遠的將來,人類將會把所有的知識資源放在網際網路上共享。傳統出版走向網際網路出版已經成為必然。CNKI是國家新聞出版總署首批批准的網際網路出版平台,可以二次出版所有傳統出版方式已經出版過的內容,也可以直接通過網路進行一次出版,出版形式多種多樣,包括文本、圖片、音頻、視頻、動畫、軟體、網路課程、科學數據等多種媒體方式。目前,CNKI已集結了7000多種期刊、近1000種報紙、18萬本博士/碩士論文、16萬冊會議論文、30萬冊圖書以及國內外1100多個專業資料庫。其中博士/碩士論文、會議論文及部分資料庫為一次出版,期刊、圖書、報紙等為二次出版。如此大的網路出版規模在世界上也是絕無僅有的。知識搜尋
CNKI是知識搜尋引擎。搜尋引擎是在漫無邊際的網際網路里發現信息的好幫手。人們最津津樂道的搜尋引擎莫過於Google。Google功能強大,幾乎可以回響人的每一個請求,但搜尋到的內容有時卻差強人意,且不說那大量的冗餘信息、重複信息、無效信息讓你無所適從,就是信息本身的資料價值有多大,也不可考量,難以判斷,無法作為決策的依據;再者,Google功能再強大,也難以搜出CNKI及各類資料庫里的內容資源。要高效、快速查找有價值的知識信息,還得靠CNKI。知識搜尋
隨著網際網路的發展和網上信息量的增加,搜尋引擎逐漸表現出自身的缺陷和不足。一是搜尋引擎對內容收錄無法提出明確標準,信息質量良莠不齊,垃圾內容越來越多;二是搜尋引擎主要是通過關鍵字匹配的簡單方式查找網頁,但是用戶通常很難用幾個孤立的關鍵字表達清楚自己的查詢需求,而排序算法又主要基於網頁的連結分析,因此,難以滿足用戶對內容準確檢索的需求;三是用戶更希望直接得到答案,而這隻有深入理解文獻內容後,才能實現。針對用戶的這些需求和搜尋引擎的不足, CNKI 推出了知識搜尋平台。1 . CNKI 文獻搜尋
基於對文獻內容的詳細標引, CNKI 文獻搜尋提供了對標題、作者、關鍵字、摘要、全文等數據項的搜尋功能;文獻搜尋還提供了多種智慧型排序算法。相關性排序考慮了文獻引用關係、全文內容、文獻來源等多種因素,使排序結果更合理。被引頻次排序是根據文獻的被引頻次進行排序;期望被引排序通過分析文獻過去被引用的情況,預測未來可能受到關注的程度;作者指數排序則是根據作者發文數量、文獻被引用、發文影響因子等評價作者的學術影響力,並據此對文獻進行排序。
CNKI 文獻搜尋提供的知識聚類功能是一般搜尋引擎沒有的。基於快速聚類算法,對返回結果的知識點進行聚類,並將主要知識點顯示給用戶,幫助用戶改善搜尋表達式,擴展搜尋意圖。
2 . CNKI 學術定義搜尋
概念的定義是描述知識的一種基本單元,被稱為定義型知識元。 CNKI 學術定義搜尋提供對學術定義的快速查詢。 CNKI 定義型知識元庫收錄了從文獻中自動抽取的學術定義 120 多萬條。
由於這些定義來源於學術期刊等文獻,是不同學者對該概念的認識和論述,因此具有更廣泛的參考價值。通過閱讀不同角度的解釋,就可以全面了解其含義和發展狀況,特別是對那些還沒有形成明確定義或存在爭議的學術概念。從任意定義出發,就可以深入地學習相關的知識。這些是工具書無法做到的。
3 . CNKI 數值知識元搜尋
量化知識是極其重要的知識,如:人均 GDP 、失業率等,也是基本的知識單元,被稱為數值型知識元。 CNKI 數值知識元搜尋提供對這類數值的搜尋。
CNKI 數值型知識元庫包含 5000 多萬條知識元,對應於具有明確含意、至少含有一個以上數值的句子。它們有兩個來源,一是 CNKI 資料庫中的文獻;二是國家統計局、商務部等發布數值內容的權威網站。數值搜尋結果通常包含用戶直接想要的答案,許多數值還能以圖表方式顯示,以幫助用戶全面了解問題。
4 . CNKI 新概念搜尋
學術研究的靈魂在於創新。創新成果通常以提出新的定理、概念、方法等形式發表出來。 CNKI 新概念搜尋提供對學術新概念的瀏覽和查詢。對學術新概念的抽取採用了多種知識挖掘方法,並由各學科領域的專家進行人工審核。
新概念搜尋可以按年份瀏覽或搜尋某一領域中的新概念,以幫助用戶及時了解學科的發展狀況,促進學者發表有創新性的研究成果。
5 . CNKI 翻譯助手
CNKI 翻譯助手能實現對中英文詞、短語、句子的輔助互譯。 CNKI 中英文對齊語料庫包含 100 多萬中英文對齊辭彙(大部分是學術辭彙)和 1000 多萬對中英文句子對。它們是從 CNKI 資料庫中含有中英文對齊標題、關鍵字、摘要等數據項中採用多級對齊技術自動抽取的。
與一般電子詞典相比,翻譯助手具有以下優勢:一是通過將句子拆分為詞,能夠對短語或句子進行輔助翻譯;二是除了辭彙翻譯外,還提供了大量例句,並按句子結構相似性進行排序;三是能夠翻譯術語的英文縮略語。
6 . CNKI 圖形、表格搜尋
CNKI 圖表搜尋能夠實現對學術圖形、表格基於內容的搜尋。圖表庫分別包含 500 萬以上從文獻中自動抽取的圖形、表格,以及它們對應的標題、所在文獻、作者、文獻中對圖表內容的闡述等,以此實現基於內容的圖表搜尋。這是目前一般搜尋引擎無法實現的。
的基礎
1 .制定了“ CNKI 系列資料庫產品標準”,涉及到從數據入編、加工到最後形成資料庫產品的全過程,從數據源頭、數據質量等方面為開展深入的知識挖掘提供了基礎。
2 .建設了“中國知識資源總庫”,包括期刊、學位論文、會議論文、報紙、年鑑、工具書等源資料庫,在資源數量和完備性上為建設各種知識搜尋產品提供了保證。
3 .建設了各種知識庫資源,包括: CNKI 知識詞典、引文資料庫、各種索引資料庫、主題詞詞典等,對實現知識搜尋、提高搜尋性能起到了基礎性作用。鄭重致歉
“中國知網”網站運營管理部向全體用戶鄭重致歉
尊敬的用戶:
2013年4月8日9:10-10:50,“中國知網”突然中斷了域名服務,嚴重影響了用戶使用,為此,“中國知網”網站運營管理部向所有用戶表示鄭重道歉。
這次事故是由“中國知網”網站運營管理中心未及時向網路域名服務機構北京盈科迅達科技有限公司繳納域名管理服務費造成的,屬於本公司內部責任事故,現已對有關責任人給予嚴肅處理。網站運營管理中心將引以為戒,加強管理,確保不再發生類似事故,並誠摯希望得到廣大用戶諒解。
再次鄭重致歉!
“中國知網”網站運營管理部
2013年4月8日12:00