Aller au contenu
Site Communauté

Asetrx

  • billets
    6
  • commentaires
    27
  • vues
    16212

Aspirer un site pour une sauvegarde


asterx

6787 vues

 

Pour faire une copie locale d'un site, utilisable sur une clé USB, par exemple, le plus simple est d'utiliser wget.

Wget est un programme en ligne de commande non interactif de téléchargement de fichiers depuis le Web. Il supporte les protocoles HTTP, HTTPS et FTP ainsi que le téléchargement au travers des proxies HTTP.

Wget peut travailler en arrière-plan et ainsi vous permettre de lancer un téléchargement et de vous déconnecter du système ! Utile, car il ne requiert pas d'action de l'utilisateur et vous permet d'effectuer ses tâches en arrière-plan, ce qui peut être très utile pour les téléchargements de données nombreuses et lourdes. Vous pouvez ainsi changer de session et laisser Wget finir le travail !

Ce logiciel libre permet le simple téléchargement d'un fichier mais aussi la recopie en local de tout ou partie d'un site qui sera par la suite consultable hors-ligne. Point fort appréciable, Wget vous permet de reprendre un téléchargement échoué suite à divers problèmes (connexions instables ou très lentes etc…). Les nombreuses options de Wget en font un outil de téléchargement très puissant !

Généralement Wget est installé sur les dernières versions de linux. Pour savoir si il y est, tapez  wget puis ENTRER. Si il ne s'y trouve pas, il vous indiquera l'erreur, sinon il dira que l'URL est manquante.

Installation de wget :

apt update && apt install wget

Créez un dossier dans votre gestionnaire de fichier. Par exemple : (sauvegarde mon site) Ouvrez le dossier et cliquez droit pour ouvrir le terminal dans ce dossier puis :

Pour aspirer le site copier collez cette commande :

wget -r -k -E -np --no-check-certificate URL_DU_SITE


Une autre méthode plus courte et tout aussi efficace consiste à créer une copie d’un site web à l’aide de wget, vous utiliserez l’option “m” suivie de l’URL dont la copie doit être effectuée.

 
wget -m URL DU SITE

 

Cela permettra de créer une copie du site en question en téléchargeant tous les liens internes et les fichiers statiques nécessaires au rendu du site.

Si vous souhaitez faire fonctionner le site web téléchargé, vous devrez également ajouter les options -k et -p.

 
wget -m -k -p https://abc.com

 

Par contre j'ignore comment réinstaller un site à partir de cette sauvegarde ! Donc si vous avez des infos, je suis preneur :wink:
Laissez vos commentaires... Merci :rolleyes:

  • J'aime 1

10 Commentaires


Commentaires recommandés

Salut ! Merci du partage.

Pour réinstaller un site à partir de pages Web aspirées, ça n'est pas possible à de très rares exceptions près. C'est comme si tu voulais refaire un plant de salade avec le contenu d'un saladier.

En fait, un site, c'est très souvent dynamique, où un genre de logiciel génère des pages à partir d'une base de données et des fichiers source (images, texte, etc.).
Et pour des raisons évidentes de sécurité, l'accès aux fichiers source est limité.

Wget ne fait donc que récupérer du contenu Web généré, et non toute la mécanique du site. Ce qui exclut la possibilité de réinstaller un site avec ce contenu … Sauf si c'est un tout petit site qui n'est justement constitué que de quelques pages web statiques (non générées dynamiquement).

Voilà, voilà ! :c_satisfied:

  • J'aime 3
Lien vers le commentaire
Le 28/12/2021 à 23:33, Le PoissonClown a dit :

Salut ! Merci du partage.

Pour réinstaller un site à partir de pages Web aspirées, ça n'est pas possible à de très rares exceptions près. C'est comme si tu voulais refaire un plant de salade avec le contenu d'un saladier.

En fait, un site, c'est très souvent dynamique, où un genre de logiciel génère des pages à partir d'une base de données et des fichiers source (images, texte, etc.).
Et pour des raisons évidentes de sécurité, l'accès aux fichiers source est limité.

Wget ne fait donc que récupérer du contenu Web généré, et non toute la mécanique du site. Ce qui exclut la possibilité de réinstaller un site avec ce contenu … Sauf si c'est un tout petit site qui n'est justement constitué que de quelques pages web statiques (non générées dynamiquement).

Voilà, voilà ! :c_satisfied:

Merci beaucoup pour cette précision. Alors à quoi ça sert de faire une sauvegarde de ce genre de fichier ?
Car j'ai un blog politico-complotiste et souverain que j'ai peur de voir disparaitre. Je cherche une solution pour préserver/ sauvegarder tout mon travail.
Si tu as une proposition, je suis preneur. À savoir que mon blog est lourd de dossiers.
Je ne l'ai pas référencé sur google et seul ceux qui ont le lien peuvent le consulter, mais il accumule pas mal de visiteurs de partages en partages.
 

Modifié par asterx
Lien vers le commentaire
il y a 46 minutes, asterx a dit :

j'ai un blog […] Je cherche une solution pour préserver/ sauvegarder tout mon travail.

Sur quel CMS ou quelle plateforme ?

[Edit: Des fois sur des plateformes captives aspirer le blog via wget ou autre c'est effectivement la seule solution. À voir, des fois des outils de scraping clés en main existent pour des plateformes populaires…]

Modifié par Le PoissonClown
  • J'aime 1
Lien vers le commentaire

je suis sur google site ! Ho oui je sais, ce n'est pas la meilleure place pour un site complotiste, mais entre ceux qui sont trop compliqué à utiliser et les autres qui sont bridé en contenu, je n'ai pas trouvé mieux.
Les outils de scraping dis-tu ? Je ne connais pas, mais je vais chercher. Merci.

  • J'aime 2
Lien vers le commentaire

Alors… Voici ce qui me semble faisable :

Étape 1

Créer un blog WordPress gratuitement en ligne.

Étape 2

Utiliser le service CMS2CMS pour y importer le contenu de Google Sites :
https://app.cms2cms.com/auth#sign-up

Étape 3

Installer un serveur Web en local chez soi pour y installer WordPress : https://www.youtube.com/watch?v=L-lgLQBIjTg

 

Étape 4

Importer son WordPress en ligne vers son WordPress en local à l'aide de l'outil d'import-export intégré : https://www.youtube.com/watch?v=K7dnOaOCRFQ

Ou si l'import de CMS2CMS a fait les chose de façon pas trop propre, opter pour l'export-import manuel : https://www.youtube.com/watch?v=01GfINWs4zI

[Et puis éventuellement : étape 5, supprimer/désactiver le blog WordPress en ligne.]

 

Modifié par Le PoissonClown
Lien vers le commentaire

Wooo ! que dire pour ne pas te vexer.... car je respecte ton travail, mais  j'avais essayé wordpress, et justement je parlais de supports "simples" ! et c'est pour ca que je suis allé sur Google site. Parce que wordpress c'est pas simple du tout ! mais pas du tout du tout ! en tout cas pas à mon niveau. Je n'ai rien compris pour la création du blog, et en approfondissant je me suis rendu compte qu'il fallait passer des heures à paramétrer un bordel monumental pour faire un site ! c'est trop compliqué pour moi. :c_wtf: sinon Wix à aussi de très belles interfaces. c'est propre et paramétrable facilement...

Pour la sauvegarde j'ai finalement fait des copier coller sur des pages Libre Office Writer. Voila. Un peu contraignant à faire, mais simple et efficace. :c_embarrassed:

Modifié par asterx
  • J'aime 1
Lien vers le commentaire

Bah écoutes, si c'est juste le contenu que tu veux récupérer, et que tu n'as pas besoin d'un outil qui te restitue automatiquement tout d'un seul coup, Wget ou HTTrack c'est suffisant.

Il y a 14 heures, asterx a dit :

wordpress c'est pas simple du tout ! mais pas du tout du tout ! en tout cas pas à mon niveau. Je n'ai rien compris pour la création du blog, et en approfondissant je me suis rendu compte qu'il fallait passer des heures à paramétrer un bordel monumental pour faire un site ! c'est trop compliqué pour moi. :c_wtf:

C'est pourtant le moins compliqué des CMS répandus. Et puis si tu galères à paramétrer le service Web ou Wordpress tu as plein de tutos pas à pas sur le Net.

Le problème avec Google Sites ou Wix, c'est que tu n'as aucun moyen de sauvegarder ni d'exporter. Ce sont des outils captifs. Il faut sauvegarder manuellement tout ce que tu y mets.

  • J'adore 1
Lien vers le commentaire
Invité
Ce billet ne peut plus recevoir de commentaires supplémentaires.
×
×
  • Créer...