Расширенное использование wget
Если у Вас есть файл с URL, которые вы хотите загрузить, то используйте параметр -i:
wget -i I<file>
Если вы укажете - вместо имени файла, то URL будут читаться из стандартного ввода (stdin).
Создать пятиуровневую копию сайта GNU со структурой папок оригинала, с одной попыткой загрузки, сохранить сообщения в gnulog:
wget -r http://www.gnu.org/ -o gnulog
Как и в примере выше, но с конвертированием ссылки в файлах HTML в локальные, для последующего автономного просмотра:
wget --convert-links -r http://www.gnu.org/ -o gnulog
Загрузить одну страницу HTML и все файлы, требуемые для отображения последней (напр. рисунки, файлы каскадных стилей и т. д.). Также сконвертировать все ссылки на эти файлы:
wget -p --convert-links http://www.server.com/dir/page.html
Страница HTML будет сохранена в www.server.com/dir/page.html и рисунки, каскадные стили и прочее будет сохранено в папке www.server.com/, кроме случая, когда файлы будут загружаться с других серверов.
Как и в примере выше, но без папки www.server.com/. Также все файлы будут сохранены в подпапках download/.
wget -p --convert-links -nH -nd -Pdownload \
http://www.server.com/dir/page.html
Загрузить index.html с www.lycos.com, отображая заголовки сервера:
wget -S http://www.lycos.com/
Сохранить заголовки в файл для дальнейшего использования.
wget -s http://www.lycos.com/
more index.html
Загрузить два высших уровня wuarchive.wustl.edu в /tmp.
wget -r -l2 -P/tmp ftp://wuarchive.wustl.edu/
Загрузить файлы GIF папки на HTTP сервере. Команда wget http://www.server.com/dir/*.gif не будет работать, так как маскировочные символы не поддерживаются при загрузке по протоколу HTTP. Используйте:
wget -r -l1 --no-parent -A.gif http://www.server.com/dir/
-r -l1 включает рекурсивную загрузку с максимальной глубиной 1. --no-parent выключает следование по ссылкам в родительскую папку, имеющую верхний уровень, -A.gif разрешает загружать только файлы с расширением .GIF. -A ``*.gif'' также будет работать.
Предположим, что во время рекурсивной загрузки вам нужно было срочно выключить/перезагрузить компьютер. Чтобы не загружать уже имеющиеся файлы, используйте:
wget -nc -r http://www.gnu.org/
Если вы хотите указать имя пользователя и пароль для сервера HTTP или FTP, используйте соответствующий синтаксис URL:
wget ftp://hniksic:mypassword@unix.server.com/.emacs
Вы хотите, чтобы загружаемые документы шли в стандартный вывод, а не в файлы?
wget -O - http://jagor.srce.hr/ http://www.srce.hr/
Если вы хотите устроить конвейер и загрузить все сайты, ссылки на которые указаны на одной странице:
wget -O - http://cool.list.com/ | wget --force-html -i -

Последние обновления: