Ci-dessous, les différences entre deux révisions de la page.
Prochaine révision | Révision précédente | ||
linux:wget [16-07-2013 23:38] edmc73 créée |
linux:wget [28-04-2023 09:22] (Version actuelle) edmc73 [Exemples] |
||
---|---|---|---|
Ligne 20: | Ligne 20: | ||
Les options sont: | Les options sont: | ||
- | >**-–recursive**: télécharge le site web entier. | + | >'' |
- | >**–-domains website.org**: ne suit pas les liens pointant hors du domaine website.org. | + | >'' |
- | >**–-no-parent**: ne suis pas les liens pointant hors du dossier tutorials/ | + | >'' |
- | >**–-page-requisites**: récupère tous les éléments qui composent la page (images, CSS et cie). | + | >'' |
- | >**-–html-extension**: enregistre les fichiers avec l’extention .html. | + | >'' |
- | >**–-convert-links**: convertit les liens afin qu’ils fontionnent localement (off-line). | + | >'' |
- | >**–-restrict-file-names=windows**: modifie les noms de fichiers afin qu’ils fonctionnent aussi sur Windows. | + | >'' |
- | >**–-no-clobber**: n’écrase pas les fichiers déjà existants (utilisé en cas de téléchargement interrompu et repris). | + | >'' |
Il peut aussi être important d’ajouter les options | Il peut aussi être important d’ajouter les options | ||
- | >**--wait=9 --limit-rate=10K** | + | >'' |
qui éviteront de surcharger le serveur qui vous fournit les pages et d’éviter, | qui éviteront de surcharger le serveur qui vous fournit les pages et d’éviter, | ||
- | >**–-wait=X** : attend X secondes entre chaque téléchargement | + | >'' |
- | >**-–limit-rate=XK** : limite la bande passante utilisée à X Ko/s | + | >'' |
Utiliser ces options permet plus de souplesse que de simplement utiliser l’option -m (mirror). | Utiliser ces options permet plus de souplesse que de simplement utiliser l’option -m (mirror). | ||
+ | |||
+ | ===== Exemples ===== | ||
+ | |||
+ | Afficher à l' | ||
+ | wget -qO- http:// | ||
+ | |||
+ | |||
+ | > -q : pour quiet, pour ne pas afficher tout le bazard de texte | ||
+ | > -O : permet de spécifier dans quel fichier stocker le contenu téléchargé par wget. Ici on ajoute un tiret afin de spécifier la redirection vers l' | ||
+ | |||
+ | Faire un appel à une url. Dans le cas d'un cron web par exemple. | ||
+ | wget -q --spider http:// | ||
+ | |||
+ | |||
+ | > -q : pour quiet, pour ne pas polluer les logs ou autre. | ||
+ | > --spider : permet de ne rien télécharger. | ||
+ | |||
+ | Télécharger un répertoire complet via ftp (ce qu'on ne peut pas faire avec de simple commande ftp) | ||
+ | |||
+ | wget -r ftp:// | ||
+ | |||
+ | ===== Nommer le fichier automatiquement ===== | ||
+ | |||
+ | Assez souvent quand on télécharge un fichier, on se retrouve avec un nom de fichier qui ne correspond à rien, exemple | ||
+ | |||
+ | $ wget http:// | ||
+ | $ ls | ||
+ | $ stable | ||
+ | |||
+ | On se retrouve avec un fichier nommé **stable** qui est en faite le dernier élément de l'url. Si on télécharge à la même url dans un navigateur web classic, on obtient le fichier **btsync_glibc23_x64.tar.gz** | ||
+ | |||
+ | Voici la solution, l' | ||
+ | |||
+ | $ wget --content-disposition http:// | ||
+ | $ ls | ||
+ | $ btsync_glibc23_x64.tar.gz | ||
+ | |