2014
13/Avr

Aspirateur de site web

Définition

Un aspirateur de site est un logiciel qui « aspire » les données d’un site web public en les téléchargeant sur un support de stockage (disque dur, clef usb, etc.).

Objectifs d’un aspirateur de site

Il peut y avoir plusieurs raisons d’utiliser un aspirateur de site web :

Sauvegarder les données d’un site web

Il existe de nombreuses méthodes pour sauvegarder les données d’un site web « ami » (c’est à dire un site web dont on ne veut pas « voler » les données). La plus directe consiste à utiliser un client FTP. Cependant, il peut arriver, dans le cadre par exemple d’une migration de site où les accès FTP sont introuvables, qu’il n’y ait pas d’autres possibilités que de devoir aspirer le site pour en conserver une copie.Cependant, si le site a été réalisé avec un CMS, cette copie ne sera pas fonctionnelle : elle donnera seulement l’image des contenus statiques du site, c’est à dire le rendu html de la page web.

Accéder à un site hors connexion

Cas de plus en plus rare, mais qui peut se produire, par exemple si on souhaite consulter les données d’un site Internet dans le train.

Faire de la veille (le gentil mot pour « surveillance »)

Afin par exemple de « surveiller » la concurrence, on peut souhaiter télécharger de manière « industrielle » et régulière les contenus de certains sites web. La surveillance des sites concurrents est cependant plus efficace lorsqu’elle est effectuée de manière ciblée et structurée à l’aide des techniques de web scraping.

Pour aller plus loin, nous vous invitons à télécharger notre livre blanc: « les 11 commandements d’un site internet qui convertit vos visiteurs en clients » et à contacter notre agence web.

Gabriel Dabi-Schwebel

Posté par

Ingénieur de formation, j'ai accompagné notamment pour Alcatel, TF1, SFR et Lagardère Active le lanc

Gabriel Dabi-Schwebel

Contact Développement web :

Jérémie Dornbusch

jd@1min30.com
07 85 92 87 77





1 Commentaire

daniel dit: 19 Jan 2019

bien


Commenter

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.

Apprenez de notre stratégie en vous inscrivant à notre newsletter