> 네트워크 관리 > wget

wget -i: 파일 목록에서 URL 다운로드

`wget -i`는 텍스트 파일에 나열된 URL 목록을 읽어와 순차적으로 파일을 다운로드하는 데 사용됩니다. 대량의 파일을 일괄적으로 다운로드하거나, 스크립트에서 동적으로 생성된 URL 목록을 처리할 때 매우 유용합니다. 각 URL은 파일의 한 줄에 하나씩 작성되어야 합니다.

개요

`wget -i`는 여러 파일을 한 번에 다운로드해야 할 때 수동으로 각 URL을 입력하는 번거로움을 줄여줍니다. 특히 웹 크롤링 결과나 특정 패턴을 가진 파일들을 다운로드할 때 효율적입니다. 이 명령어는 지정된 파일 내의 모든 URL을 순서대로 처리하며, 각 다운로드에 대해 `wget`의 다른 옵션들을 함께 적용할 수 있습니다.

주요 특징

  • URL 목록 일괄 처리
  • 스크립트 연동 용이
  • 다운로드 재개 기능 지원
  • 다양한 `wget` 옵션과 조합 가능

주요 옵션

`wget -i`와 함께 자주 사용되는 옵션들입니다.

입력/출력 제어

생성된 명령어:

명령어를 조합해 보세요.

설명:

`wget` 명령어를 실행합니다.

위 옵션들을 조합하여 AI와 함께 가상으로 명령어를 실행해 보세요.

사용 예시

`wget -i` 명령어를 활용한 다양한 시나리오입니다.

URL 파일 생성 예시

echo "http://example.com/file1.zip\nhttp://example.com/image.jpg\nhttps://www.gnu.org/software/wget/manual/wget.pdf" > urls.txt

다운로드할 URL 목록을 포함하는 `urls.txt` 파일을 생성합니다.

기본 사용법

wget -i urls.txt

`urls.txt` 파일에 나열된 모든 URL을 현재 디렉토리에 다운로드합니다.

특정 디렉토리에 다운로드

wget -i urls.txt -P /data/downloads

다운로드된 파일을 `/data/downloads` 디렉토리에 저장합니다.

다운로드 재개 및 로그 기록

wget -i urls.txt -c -o wget_log.txt

중단된 다운로드를 이어서 받고, 모든 진행 상황과 오류를 `wget_log.txt` 파일에 기록합니다.

다운로드 속도 제한 및 기존 파일 덮어쓰지 않기

wget -i urls.txt --limit-rate=500k -nc

다운로드 속도를 500KB/s로 제한하고, 이미 존재하는 파일은 덮어쓰지 않고 건너뜁니다.

팁 & 주의사항

`wget -i` 사용 시 효율성을 높이고 잠재적인 문제를 방지하기 위한 팁입니다.

유용한 팁

  • **URL 파일 형식**: 각 줄에 하나의 URL을 작성해야 합니다. 빈 줄이나 주석(주로 `#`으로 시작)은 `wget`에 의해 자동으로 무시됩니다.
  • **다운로드 재개**: `-c` 옵션을 사용하면 이전에 중단된 다운로드를 이어서 받을 수 있어 대용량 파일이나 불안정한 네트워크 환경에서 매우 유용합니다.
  • **로그 확인**: `-o` 옵션으로 로그 파일을 생성하여 다운로드 진행 상황, 오류 등을 추적할 수 있습니다. 이는 문제 해결에 큰 도움이 됩니다.
  • **병렬 다운로드**: `wget -i` 자체는 병렬 다운로드를 지원하지 않습니다. 여러 파일을 동시에 다운로드하려면 `xargs -P`와 같은 다른 도구와 조합하거나 `aria2c`와 같은 병렬 다운로드 관리자를 고려하세요.
  • **파일 덮어쓰기 방지**: `-nc` (no-clobber) 옵션을 사용하면 이미 존재하는 파일을 덮어쓰지 않고 건너뛸 수 있어, 실수로 중요한 파일을 손상시키는 것을 방지합니다.

동일 카테고리 명령어