本页使用了标题或全文手工转换

archive.is

维基百科,自由的百科全书
跳到导航 跳到搜索

archive.is
Archive.is.jpg
Archive.is-Screenshot.png
archive.is網站截圖
网站类型 數位圖書館
语言 多语言
网站 archive.is
Alexa排名 4,767 (Jul 2015)[1]
商业性质
注册
推出时间 2012
现状 線上

archive.is(又名為archive.today)是一個私人資助的网页存档網站,[2][3] 資料中心位於歐洲法國的北部-加来海峡[4] 這個網站典藏英语Web archiving檔案館使用Apache HadoopApache Accumulo英语Apache Accumulo軟體。它可以一次取回一個類似於WebCite[5]的小於50MB的頁面,但收錄Google地圖Twitter

archive.is会根据版權所有者的合乎數位千年版權法案(DMCA)的撤除請求移除已存檔的頁面。[6]

它每次請求都會擷取網頁的文字內容,載入不含活動元素或指令碼的Web 2.0網站或由JavaScript產生的圖片與框架內容。 截圖是1024×768像素,沒有快顯畫面。 [7][8]

截至2015年,archive.is還支援了Memento Project英语Memento ProjectAPI[9]並且開發了Firefox瀏覽器[10]與Chrome瀏覽器[11]的外掛程式。[9][12]

封鎖[编辑]

在2015年7月21日,網站管理者們封鎖了芬蘭的IP位址,他们在其Twitter上聲稱,这麼做是為了避免與芬蘭政府的糾紛升級。他們拒絕提供額外的資訊。[13]此網站也被中國當局與哈薩克斯坦當局封鎖。此站同樣被OpenDNS封鎖。[14]

易名[编辑]

archive.is曾多次更換網域名稱。

從建站初期至2014年4月14日是使用「Archive.is」(首字母為大寫)。

在2014年4月15日時,該網站的名稱已更名為「archive.today」(首字母為小寫)。[15][16]

在2015年春季又改回了「archive.is」(首字母為小寫)。[17][18]

使用案例[编辑]

這個檔案館会被一些作者或駭客活動分子英语hacktivists使用。

評論[编辑]

有別於比如網際網路檔案館時光機Internet Archive Wayback Machine)的主动性網路蜘蛛,archive.is每次只擷取網站的一個頁面,所以不遵守「Robots排除標準」。 [23]

從法律上講,archive.today與網際網路檔案館時光機有很大不同。互联网档案馆的时光机抓取网页时遵循通常的Robots指令,这种指令可以阻止其抓取特定的网页。然而,网站无法阻止archive.today的用户对其制作站点镜像。

參見[编辑]

參考文獻[编辑]

  1. ^ archive.is Site Info. Site Info. Alexa Internet. [2015-06-14]. 
  2. ^ pseric. Archive.is 線上備份網頁工具,可下載完整網頁內容或將畫面轉為擷圖. Free.co.tw. 2015-06-27 [2015-07-26]. 
  3. ^ Martin Brinkmann. Create publicly available web page archives with archive.is. GHacks. 2015-04-22 [2015-06-13]. 
  4. ^ archive.is status. Stat Radar. [2013-05-08]. (原始内容存档于2013-07-27). 
  5. ^ WebCite
  6. ^ "How can I delete an archived page?"
     
  7. ^ archive.today – webpage capture. archive.today. [2013-05-08]. (原始内容存档于2012-06-28). 
  8. ^ archive.today FAQ. archive.today. [2013-05-08]. (原始内容存档于2013-04-20). 
  9. ^ 9.0 9.1 Nelson, Michael L. Archive.is Supports Memento. Research and Teaching Updates. Web Science and Digital Libraries Research Group at Old Dominion University. 2013-07-09 [2013-09-17]. (原始内容存档于2013-07-27). 
  10. ^ Archiveror – Get this Extension for 🦊 Firefox (en-US). addons.mozilla.org. 
  11. ^ archive.today Button. chrome.google.com. 
  12. ^ "archive.is" Memento Protocol Information. Memento Development Group. Retrieved 17 September 2013.
  13. ^ archive.today. @FukBoyKuupe @atlasnodded I blocked proactively in order not to escalate as in recent Russia vs. http://archive.org  case.. 2015-07-21. 
  14. ^ Jared. Even my school blocks http://archive.today , what the hell?pic.twitter.com/hLbfISLIGI. 2015-07-24. 
  15. ^ archive.is - webpage capture - Google 2014年4月14日 11:21:06 GMT (Peeep.usのキャッシュ
  16. ^ archive.today - webpage capture - Google 2014年4月18日 17:40:45 GMT (Peeep.usのキャッシュ
  17. ^ https://archive.today:443/ - 2015年3月22日 22:49 - ウェブ魚拓. megalodon.jp. 
  18. ^ https://archive.is:443/ - 2015年5月14日 01:08 - ウェブ魚拓. megalodon.jp. 
  19. ^ Koebler, Jason. Dear GamerGate: Please Stop Stealing Our Shit. 2014-10-29. 
  20. ^ Julian Assange - When Google Met WikiLeaks 互联网档案馆存檔,存档日期2015-07-21.
  21. ^ user, Debian. Julian Assange - Google Is Not What It Seems. http://xml.openoffice.org/odf2xhtml. 2014-10-24.  外部链接存在于|website= (帮助)
  22. ^ US Army Official Website Hacked — Syrian Electronic Army. 2015-06-14. (原始内容存档于2015-06-11). 
  23. ^ Dascalescu, Dan. Web page archiving - Dan Dascalescu's Wiki (review). Wiki.dandascalescu.com. 2013-02-18 [2013-10-03]. 

外部連結[编辑]