时光机
网站时光机是互联网档案馆最重要的服务之一,其名取自一部名为The Rocky and Bullwinkle Show的美国卡通片。时光机允许人们去搜索和访问其网页存档。在一些国家和地区,时光机这个术语的使用已经非常普遍,“时光机”和“互联网档案馆”甚至开始被当做同义词使用。
A 使用了2016年10月以前的旧版计数系统
| B 使用了2016年10月以后的新版计数系统
|
Archive-It
Archive-it是一款帮助机构和个人建立存档的工具。一旦目标网站的URL被输入并保存且该网站允许互联网档案馆所使用的robots.txt访问,该网页将会成为时光机的一部分。[37]截至2014年3月 (2014-03)[update],Archive-it在美国的46个州和其他16个国家共有超过275个机构是其合作伙伴,共有超过74亿个网页的在线存档。
收集书目
互联网档案馆收集了世界各地的数字化图书以及各大图书馆和文化遗产机构的特殊藏品。互联网档案馆在5个国家经营着33个圖書掃描中心,其活动受图书馆和基金会的财政支持。[38][39]截至2013年7月 (2013-07)[update],档案馆共收集了440万本书,每月的下载量超过1500万。[38]截至2008年11月 (2008-11)[update],档案馆共有100万个网络文本,总大小高达0.5PB,涵盖了原始照相图像、裁剪和歪斜的图像、PDF文件和原始OCR数据。[40]
各语言的文本数
1
|
语言
|
英语
|
法语
|
德语
|
西班牙语
|
汉语
|
阿拉伯语
|
---|
文本数(2015年11月27日)
|
6,553,945[41] |
358,721[42] |
344,810[43] |
134,170[44] |
84,147[45] |
66,786[46] |
---|
2
|
语言
|
荷蘭語
|
葡萄牙語
|
俄语
|
乌尔都语
|
日语
|
合计(2016年10月30日)
|
---|
文本数(2015年11月27日)
|
30,237[47] |
25,938[48] |
22,731[49] |
14,978[50] |
14,795[51] |
10,612,003
1
|
年代
|
1800年代
|
1810年代
|
1820年代
|
1830年代
|
1840年代
|
1850年代
|
---|
文本数
(2015年11月27日)
|
39,842[53] |
51,151[54] |
79,476[55] |
105,021[56] |
127,649[57] |
180,950[58] |
---|
2
|
年代
|
1860年代
|
1870年代
|
1880年代
|
1890年代
|
1900年代
|
1910年代
|
---|
文本数
(2015年11月27日)
|
210,574[59] |
214,505[60] |
285,984[61] |
370,726[62] |
504,000[63] |
455,539[64] |
---|
3
|
年代
|
1920年代
|
1930年代
|
1940年代
|
1950年代
|
1960年代
|
1970年代
|
---|
文本数
(2015年11月27日)
|
185,876[65] |
70,190[66] |
85,062[67] |
81,192[68] |
125,977[69] |
206,870[70] |
---|
4
|
年代
|
1980年代
|
1990年代
|
2000年代
|
2010年代
|
|
|
---|
文本数
(2015年11月27日)
|
181,129[71] |
272,848[72] |
579,905[73] |
855,253
除了上述内容之外,互联网档案库还收集了大量的数字媒体,这些数字媒体均符合美国公共领域或CC授权协议。这些媒体文件均会根据媒体类型(moving images、audio、text、etc.)被组织成集合,并根据各项标准被分入子集合。例如大都會藝術博物館提供的相关资料就会被分入一个子集,目前该集合相关资料的数量已经超过了140,000个[75]。每个主集合都含有一个“社区”子集合(以前被称为“开源”)用于存储公众的贡献。
音频收藏
音频档案包括音乐,有声读物,新闻广播,旧时广播的节目和各种其他音频文件。该系列中有超过200,000个免费数字录音。子集包括有声读物和诗歌,播客,[76]非英语音频等。[77] Live Music Archive子集包括来自独立音乐家的超过170,000个音乐会录音,以及更为成熟的艺术家和音乐合奏,以及关于录制他们的音乐会的宽松规则,例如Grateful Dead,以及最近的The Smashing Pumpkins。此外,Jordan Zevon还允许互联网档案馆收藏他父亲Warren Zevon的音乐会录音。Zevon系列从1976年至2001年不等,包含126场音乐会,包括1,137首歌曲。[78]
布鲁克林博物馆
此系列包含大约3,000件布鲁克林博物馆的物品。[79]
镜像網站註釋参考文献
- ^ Internet Archive: About the Archive. Wayback Machine. 2000-04-08 [2016-03-13]. (原始内容存档于2000-04-08).
- ^ archive.org WHOIS, DNS, & Domain Info – DomainTools. WHOIS. [2016-03-13]. (原始内容存档于2018-11-05).
- ^ Internet Archive: Offline Archive. archive.org. [2019-11-22]. (原始内容存档于2019-10-29).
- ^ archive.org Site Info. Alexa Internet. [2018年11月13日]. (原始内容存档于2018年11月13日).
- ^ Internet Archive: About IA. archive.org. [2022-02-23].
- ^ Internet Archive: Projects. Internet Archive. [2013-03-06]. (原始内容存档于2013-03-01).
- ^ Grotke, A. (2011). Web Archiving at the Library of Congress. Computers In Libraries, 31 no. 10 (December 2011), p. 15-19.
- ^ Womack, David. Who Owns History?. Cabinet Magazine. No. 10. Spring 2003 [2013-04-13]. (原始内容存档于2013-03-19).
- ^ "Members" International Internet Preservation Consortium. Netpreserve.org
- ^ "Internet Archive officially a library" (页面存档备份,存于互联网档案馆), May 2, 2007. Archive.org
- ^ Internet Archive 放大招,2400 款 MS-DOS 游戏任你玩. ifanr爱范儿. 2015-01-07 [2017-01-29]. (原始内容存档于2017-02-02).
- ^ 互联网真能帮人类历史存档吗?. 腾讯科技. 2015-01-24 [2016-10-30]. (原始内容存档于2016-09-15).
- ^ Internet Archive: In the Collections. Wayback Machine. 2000-06-06 [2016-03-15]. (原始内容存档于2000-06-06).
- ^ "Daisy Books for the Print Disabled" (页面存档备份,存于互联网档案馆), February 25, 2013. Internet Archive.
- ^ Kahle, Brewster (August 7, 2012). "Over 1,000,000 Torrents of Downloadable Books, Music, and Movies" (页面存档备份,存于互联网档案馆). Internet Archive Blogs.
- ^ 16.0 16.1 Van der Sar, Ernesto. Internet Archive Starts Seeding 1,398,875 Torrents. TorrentFreak. 2012-08-07 [2014-03-21]. (原始内容存档于2012-08-08).
- ^ "Hot List for bt1.us.archive.org (Updated August 7 2012, 7:31 pm PDT)" (页面存档备份,存于互联网档案馆). US Cluster. Internet Archive.
- ^ "Welcome to Archive torrents" (页面存档备份,存于互联网档案馆). Internet Archive.
- ^ Alexander, Kurtis. Internet Archive's S.F. office damaged in fire. San Francisco Chronicle. 2013-11-06 [2014-03-21]. (原始内容存档于2013-12-12).
- ^ Fire Update: Lost Many Cameras, 20 Boxes. No One Hurt. Internet Archive Blogs. 2013-11-06 [2014-03-21]. (原始内容存档于2014-03-14).
- ^ Shu, Catherine. Internet Archive Seeking Donations To Rebuild Its Fire-Damaged Scanning Center. TechCrunch. 2013-11-06 [2014-03-21]. (原始内容存档于2014-03-17).
- ^ Internet Archive. Internet Archive. [2014-03-02]. (原始内容存档于2005-12-31).
- ^ Internet Archive. Internet Archive. [2014-03-02]. (原始内容存档于2006-12-28).
- ^ Internet Archive. Internet Archive. [2014-03-02]. (原始内容存档于2007-12-28).
- ^ Internet Archive. Internet Archive. [2014-03-02]. (原始内容存档于2008-12-24).
- ^ Internet Archive. Internet Archive. [2014-03-02]. (原始内容存档于2009-12-20).
- ^ Internet Archive. Internet Archive. [2014-03-02]. (原始内容存档于2010-12-30).
- ^ Internet Archive. Internet Archive. [2014-03-02]. (原始内容存档于2011-08-30).
- ^ Internet Archive. Internet Archive. [2014-03-02]. (原始内容存档于2002-10-14).
- ^ Internet Archive. Internet Archive. [2014-03-02]. (原始内容存档于2013-12-31).
- ^ 430 Billion Web Pages Saved. ... Help Us Do More! | Internet Archive Blogs. blog.archive.org. [2018-06-10]. (原始内容存档于2018-07-07) (美国英语).
- ^ Internet Archive. Internet Archive. [2018-12-09]. (原始内容存档于2015-05-31).
- ^ Internet Archive. Internet Archive. [2018-12-09]. (原始内容存档于2016-09-30).
- ^ Goel, Vinay. Defining Web pages, Web sites and Web captures. Internet Archive. 2016-10-23 [2018-12-09]. (原始内容存档于2018-12-09).
- ^ Internet Archive. Internet Archive. [2018-12-09]. (原始内容存档于2017-06-01).
- ^ Internet Archive. Internet Archive. [2018-12-09]. (原始内容存档于2018-12-09).
- ^ Rossi, Alexis. Fixing Broken Links on the Internet. Internet Archive. 2013-10-25 [2013-12-29]. (原始内容存档于2013-12-16).
- ^ 38.0 38.1 Hoffelder, Nate (July 9, 2013). "Internet Archive Now Hosts 4.4 Million eBooks, Sees 15 Million eBooks Downloaded Each Month" (页面存档备份,存于互联网档案馆). The Digital Reader.
- ^ Kahle, Brewster (May 23, 2008). "Books Scanning to be Publicly Funded" (页面存档备份,存于互联网档案馆). Internet Archive Forums.
- ^ "Bulk Access to OCR for 1 Million Books" Archived 2012-11-28 at WebCite. Open Library Blog. November 24, 2008.
- ^ Internet Archive Search : (language:eng OR language:"English"). Internet Archive. [2015-11-27]. (原始内容存档于2016-04-15).
- ^ Internet Archive Search : (language:fre OR language:"French"). Internet Archive. [2015-11-27]. (原始内容存档于2016-03-17).
- ^ Internet Archive Search : (language:ger OR language:"German"). Internet Archive. [2015-11-27]. (原始内容存档于2016-01-14).
- ^ Internet Archive Search : (language:spa OR language:"Spanish"). Internet Archive. [2015-11-27]. (原始内容存档于2016-04-08).
- ^ Internet Archive Search : (language:Chinese OR language:"chi") AND mediatype:texts. Internet Archive. [2015-11-27]. (原始内容存档于2016-04-08).
- ^ Internet Archive Search : (language:ara OR language:"Arabic"). Internet Archive. [2015-11-27]. (原始内容存档于2016-03-22).
- ^ Internet Archive Search : (language:Dutch OR language:"dut") AND mediatype:texts. Internet Archive. [2015-11-27]. (原始内容存档于2016-04-08).
- ^ Internet Archive Search : (language:Portuguese OR language:"por") AND mediatype:texts. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-15).
- ^ Internet Archive Search : (language:rus OR language:"Russian") AND mediatype:texts. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-19).
- ^ Internet Archive Search : (language:urd OR language:"Urdu") AND mediatype:texts. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-15).
- ^ Internet Archive Search : (language:Japanese OR language:"jpn") AND mediatype:texts. Internet Archive. [2015-11-27]. (原始内容存档于2016-04-08).
- ^ Internet Archive Search : mediatype:texts. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-05).
- ^ Internet Archive Search : mediatype:texts AND date:[1800-01-01 TO 1809-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-04-09).
- ^ Internet Archive Search : mediatype:texts AND date:[1810-01-01 TO 1819-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-26).
- ^ Internet Archive Search : mediatype:texts AND date:[1820-01-01 TO 1829-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-15).
- ^ Internet Archive Search : mediatype:texts AND date:[1830-01-01 TO 1839-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-04-09).
- ^ Internet Archive Search : mediatype:texts AND date:[1840-01-01 TO 1849-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-26).
- ^ Internet Archive Search : mediatype:texts AND date:[1850-01-01 TO 1859-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-17).
- ^ Internet Archive Search : mediatype:texts AND date:[1860-01-01 TO 1869-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-13).
- ^ Internet Archive Search : mediatype:texts AND date:[1870-01-01 TO 1879-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-15).
- ^ Internet Archive Search : mediatype:texts AND date:[1880-01-01 TO 1889-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-16).
- ^ Internet Archive Search : mediatype:texts AND date:[1890-01-01 TO 1899-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-11).
- ^ Internet Archive Search : mediatype:texts AND date:[1900-01-01 TO 1909-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-18).
- ^ Internet Archive Search : mediatype:texts AND date:[1910-01-01 TO 1919-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-19).
- ^ Internet Archive Search : mediatype:texts AND date:[1920-01-01 TO 1929-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-04-09).
- ^ Internet Archive Search : mediatype:texts AND date:[1930-01-01 TO 1939-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-04-09).
- ^ Internet Archive Search : mediatype:texts AND date:[1940-01-01 TO 1949-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-26).
- ^ Internet Archive Search : mediatype:texts AND date:[1950-01-01 TO 1959-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-16).
- ^ Internet Archive Search : mediatype:texts AND date:[1960-01-01 TO 1969-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-15).
- ^ Internet Archive Search : mediatype:texts AND date:[1970-01-01 TO 1979-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-04-09).
- ^ Internet Archive Search : mediatype:texts AND date:[1980-01-01 TO 1989-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-04-09).
- ^ Internet Archive Search : mediatype:texts AND date:[1990-01-01 TO 1999-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-11).
- ^ Internet Archive Search : mediatype:texts AND date:[2000-01-01 TO 2009-12-31]. Internet Archive. [2015-11-27]. (原始内容存档于2016-03-26).
- ^ Internet Archive Search : mediatype:texts AND date:[2010-01-01 TO 2015-11-27]. Internet Archive. [2015-11-27]. (原始内容存档于2016-04-09).
- ^ Metropolitan Museum of Art - Gallery Images: Free Image : Download & Streaming : Internet Archive. Internet Archive. [2014-12-04]. (原始内容存档于2015-01-03).
- ^ How to Host Podcast MP3 on Archive.org. TurboFuture. [2019-02-25]. (原始内容存档于2017-08-04) (英语).
- ^ Download & Streaming : Audio Archive : Internet Archive. archive.org. [2019-02-25]. (原始内容存档于2019-02-24) (英语).
- ^ Clarke, John. Warren Zevon Live Shows Hit the Web, Possible Film in the Works. Rolling Stone. 2009-06-03 [2019-02-25]. (原始内容存档于2019-02-26) (美国英语).
- ^ Brooklyn Museum : Free Image : Free Download, Borrow and Streaming : Internet Archive. archive.org. [2019-02-25]. (原始内容存档于2019-02-24) (英语).
- ^ International School of Information Science (ISIS). www.bibalex.org. International School of Information Science. [2016-10-30]. (原始内容存档于2016-10-31).
延伸阅读外部連結 |
---|
|
---|
|
|