互联网档案馆
Internet Archive
Internet Archive logo and wordmark.svg
Early screenshots from the Internet archive.jpg
互联网档案馆1997年1月26日的早期样式
公司类型501(c)条款非盈利组织
网站类型
數位圖書館
语言英語
成立1996年5月12日,​24年前​(1996-05-12[1][2]
總部美國加利福尼亞州舊金山列治文区
37°48′0″N 122°27′37″W / 37.80000°N 122.46028°W / 37.80000; -122.46028坐标37°48′0″N 122°27′37″W / 37.80000°N 122.46028°W / 37.80000; -122.46028
创始人布魯斯特·卡利
服务存档、開放圖書館互聯網檔案館(2001年起)、网络标签、NASA图片、普林格档案英语Prelinger Archives
员工200
网址archive.org
archivecrfip2lpi.onion Tor-logo-2011-flat.svg(如何访问)[3]
Alexa排名 272(2018年11月[4]
推出时间1996年 (1996)
旧“互联网档案馆”总部(1996年 - 2009年11月)
新“互联网档案馆”总部(2009年11月 - )

互联网档案馆(英語:Internet Archive)是美国的一個由Alexa创始人布鲁斯特·卡利创办于1996年的非營利性的、提供互联网多媒体资料档案阅览服务數位圖書館,总部位于加利福尼亚州旧金山列治文区,其使命是“普及所有知识”(英語:universal access to all knowledge.[notes 1][notes 2]。该“档案馆”提供的数字资料有如网站、网页、图形材料音乐、视频、音频、软件、动态图像和数百万书籍等的永久性免费储存及获取的副本。 迄至2012年10月,其信息储量达到10PB[5][6]。除此之外,該檔案館也是網絡開放與自由化的倡議者之一。

数据来源

该档案馆的數據是由自帶的網絡爬蟲自動搜集的,網站存档英语Web archiving檔案館“網站時光機”抓取了超過1500億的網頁[7][8]

资金情况

年度預算約为1000萬美元,來源則是其網頁爬蟲服務、合作關係、贊助以及卡利-奧斯丁基金會[9]。總部僱員只有數十人,大部份僱員工作於書籍掃描中心,在紅木城也有數據中心。

数据库

档案馆的數據庫是國際網際網路保留協會英语International Internet Preservation Consortium成員[10],2007年被加利福尼亞州選為官方指定圖書館[11]。档案馆收集的数据是各种各样的。截止2015年年初,互联网档案馆共收录了2400款MS-DOS游戏[12]

歷史

1996年,卡利(Brewster Kahle)在創建盈利性的Alexa Internet時同時也創立了互联网檔案館;同年10月開始收集儲存數據[13][14]。不過,直到2001年開發了「時光機」前,這些數據都無法存取。1999年末擴展收集範圍[15]

2012年8月,宣布[16]將在其現存的130萬檔案的下載選項中加入BitTorrent[17][18]。因為通過兩個檔案數據中心協調,這成為從該檔案館下載數據的最快方法[17][19]

2013年11月6日,檔案館在里奇蒙德區的總部失火,損壞了許多設備和一些附近的公寓[20][21],預計損失達到60萬美元[22]