Startpagina > Netwerkbeheer > wget

wget -r: Recursieve download van websites

wget -r is een krachtig commando dat wordt gebruikt om de inhoud van een website of een specifieke map recursief naar het lokale systeem te downloaden. Door links te volgen tot een gespecificeerde diepte, kopieert het alle bestanden en mappen, wat handig is voor het offline verkennen van websites of voor back-ups.

Overzicht

wget -r scant en downloadt automatisch bestanden en mappen van een webserver tot een gespecificeerde diepte. Dit kan worden gebruikt voor het spiegelen van websites, offline browsen, of het verzamelen van specifieke bestandstypen.

Belangrijkste functies

  • Volledige website spiegelen
  • Links volgen tot gespecificeerde diepte
  • Bestandstypen filteren
  • Links converteren voor offline browsen

Belangrijkste opties

Dit zijn de belangrijkste opties die de recursieve downloadactie van wget -r nauwkeurig kunnen regelen.

Recursieve downloadcontrole

Opslag en uitvoer

Gegenereerde opdracht:

Probeer de opdrachtcombinaties.

Uitleg:

`wget` Voer het commando uit.

Combineer deze opties en voer de opdracht virtueel uit met de AI.

Gebruiksvoorbeelden

Dit zijn praktische voorbeelden van het gebruik van het wget -r commando.

Basis recursieve download

wget -r https://example.com/docs/

Downloadt recursief alle inhoud van de gespecificeerde URL.

Website spiegelen (diepte beperken, links converteren)

wget -r -l 2 -k -p https://example.com/

Downloadt een website tot een diepte van 2 niveaus en converteert links naar lokale paden om offline browsen mogelijk te maken.

Alleen specifieke bestandstypen downloaden

wget -r -A "*.pdf,*.doc" https://example.com/files/

Downloadt recursief alleen PDF- en DOC-bestanden uit de gespecificeerde map.

Downloaden zonder naar bovenliggende mappen te gaan

wget -r -np https://example.com/data/

Downloadt recursief alleen binnen de huidige map en gaat niet naar bovenliggende mappen.

Downloadmap specificeren

wget -r -P /home/user/websites https://example.com/

Slaat alle gedownloade bestanden op in de specifieke lokale map `/home/user/websites`.

Downloadlimiet en wachttijd instellen

wget -r --limit-rate=200k --wait=1 https://example.com/large-site/

Beperkt de downloadsnelheid tot 200 KB/s en wacht 1 seconde tussen elk verzoek om de serverbelasting te verminderen.

Tips & Aandachtspunten

Bij het gebruik van wget -r is het belangrijk om voorzichtig te zijn met het niet overbelasten van de server en om de efficiëntie te verhogen door alleen de benodigde bestanden te downloaden.

Nuttige tips

  • Verminder serverbelasting met de `--wait` optie: Het versturen van veel verzoeken in korte intervallen kan de server belasten, dus het gebruik van opties zoals `--wait=1` (1 seconde wachten) is aan te raden.
  • Beperk bandbreedte met `--limit-rate`: U kunt de downloadsnelheid beperken om te voorkomen dat u te veel netwerkbandbreedte gebruikt.
  • Respecteer de Robots Exclusion Protocol (`robots.txt`): De meeste websites specificeren hun crawlregels via een `robots.txt`-bestand. `wget` respecteert dit standaard, maar u kunt het negeren met de optie `--execute=robots=off` (niet aanbevolen).
  • Gebruik `-l` (diepte) en `-np` (geen bovenliggende mappen) opties om oneindige lussen te voorkomen: Onjuiste configuraties kunnen leiden tot oneindige lussen of het downloaden van ongewenste grote hoeveelheden bestanden.
  • Gebruik `-k` (links converteren) en `-p` (pagina-vereisten) opties samen voor offline browsen: Deze twee opties zijn essentieel voor het soepel navigeren door gedownloade websites lokaal.

Hétzelfde categoriecommando