Archive.today
Contributeurs aux projets Wikimedia
Article ImagesArchive.today (anciennement archive.is) est un site web dont le but est d'archiver des pages web et dont le centre de données aurait été situé en France, dans le Nord-Pas-de-Calais[1]. Il fonctionne en utilisant Apache Hadoop et Apache Accumulo.
Adresse | Site officiel |
---|---|
Publicité | non |
Type de site | Archivage web |
Langue | anglais |
Inscription | non |
Lancement | 2012 |
État actuel | actif |
modifier | |
Bien que le site ne donne aucune indication sur son créateur ni sur son moyen de financement[2], certaines personnes se sont mises à la recherche de son créateur et il se pourrait que ce soit un certain Denis Petrov[3] de New-York qui soit le créateur de ce site.
Sa particularité est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier robots.txt[4]. Il est donc impossible d'interdire l'archivage de son site web, ce qui explique pourquoi ce site est fréquemment critiqué.
Il a aussi de nombreuses adresses différentes qui se redirigent les unes entre les autres et changent souvent. Il semblerait que se soit à cause de la réputation des "TLD" et qu'il change souvent les adresses pour cela[5].
- ↑ (fr + en) Archive.Today, « Archive.is Blog - Parlez-vous français ? Parce que j'ai remarqué que vous site Internet vient de France, au moins les serveurs de celui-ci. Si oui, le Nord-Pas-de-Calais est-il un bon endroit ? » , sur Archive.Today (consulté le )
- ↑ (en) Archive.Today, « FAQ » , sur Archive.Today (consulté le )
- ↑ (en) TrueDetective, « On which country are the creators and servers of archive.today / archive.is based? » , sur Stack Exchange (consulté le )
- ↑ (en) « Comparison of web archiving services », sur dandascalescu.com, (consulté le ).
- ↑ (en) Archive.Today, « Archive.is Blog - Why has 'is' been redirecting to 'vn' and 'md' today? Should we start switching over, or is this a temporary thing? » , sur Archive.Today (consulté le )
- (en) « Create publicly available web page archives with Archive.is », sur ghacks.net.