archive[文檔伺服器]

archive[文檔伺服器]
更多義項 ▼ 收起列表 ▲

網際網路檔案館(英語:Internet Archive)是一個非營利性的數字圖書館組織。成立於1996年,由Alexa創始人布魯斯特·卡利創辦。提供數字數據如網站、音樂、動態圖像、和數百萬書籍的永久性免費存儲及獲取。迄至2012年10月,其信息儲量達到10PB。除此之外,該檔案館也是網路開放與自由化的倡議者之一。

簡介

網際網路檔案館(英語:Internet Archive)是一個非營利性的數字圖書館組織。成立於1996年,由Alexa創始人布魯斯特·卡利創辦。提供數字數據如網站、音樂、動態圖像、和數百萬書籍的永久性免費存儲及獲取。迄至2012年10月,其信息儲量達到10PB。除此之外,該檔案館也是網路開放與自由化的倡議者之一。

其數據是由自帶的網路爬蟲自動蒐集的,其網站典藏檔案館網站時光機,抓取了超過1500億的網頁。

其年度預算約為1000萬美元,來源則是其網頁爬蟲服務、合作關係、贊助以及卡利-奧斯丁基金會。總部位於舊金山里奇蒙德區,此地雇員只有數十人,大部分雇員工作於書籍掃描中心,在紅木城也有數據中心。

該資料庫是國際網際網路保存聯盟成員,2007年被加利福尼亞州選為官方指定圖書館。檔案館收集的數據是各種各樣的。截止2015年年初,網際網路檔案館共收錄了2400款MS-DOS遊戲。

歷史

1996年,卡利在創建盈利性的Alexa Internet時同時也創立了網際網路檔案館;同年10月開始收集存儲數據。不過,直到2001年開發了“時光機”前,這些數據都無法訪問。1999年末擴展收集範圍。

2012年8月,宣布將在其現存的130萬檔案的下載選項中加入BitTorrent。因為通過兩個檔案數據中心協調,這成為從該檔案館下載數據的最快方法。

2013年11月6日,檔案館在里奇蒙德區的總部失火,損壞了許多設備和一些附近的公寓,預計損失達到60萬美元。

網頁存檔

時光機

網站時光機是網際網路檔案館最重要的服務之一。其名取自一部名為The Rocky and Bullwinkle Show的美國卡通片,時光機允許人們去搜尋和訪問其網頁存檔。在一些國家和地區,時光機這個術語的使用已經非常普遍,“時光機”和“網際網路檔案館”甚至開始被當做同義詞使用。

Archive-It

Archive-it是一款幫助機構和個人創建存檔的工具。一旦目標網站的URL被輸入並保存且該網站允許網際網路檔案館所使用的Robots.txt訪問,該網頁將會成為時光機的一部分。截至2014年3月,Archive-it在美國的46個州和其他16個國家共有超過275個機構是其合作夥伴,共有超過74億個網頁的線上存檔。

收集書目

網際網路檔案館收集了世界各地的數位化圖書以及各大圖書館和文化遺產機構的特殊藏品。網際網路檔案館在5個國家經營著33個圖書掃描中心,其活動受圖書館和基金會的財政支持。截至2013年7月,檔案館共收集了440萬本書,每月的下載量超過1500萬。截至2008年11月,檔案館共有100萬個網路文本,總大小高達0.5PB,涵蓋了原始照相圖像、裁剪和歪斜的圖像、PDF檔案和原始OCR數據。

視頻資料

除了上述內容之外,網際網路檔案庫還收集了大量的數字媒體,這些數字媒體均匹配美國公共領域或CC授權協定。這些媒體檔案均會根據媒體類型(moving images、audio、text、etc.)被組織成集合,並根據各項標準被分入子集合。例如大都會藝術博物館提供的相關資料就會被分入一個子集,目前該集合相關資料的數量已經超過了140,000個。每個主集合都含有一個“社區”子集合(以前被稱為“開源”)用於存儲公眾的貢獻。

相關詞條

相關搜尋

熱門詞條

聯絡我們