Расширенное использование wget

Если у Вас есть файл с URL, которые вы хотите загрузить, то используйте параметр -i:

            wget -i I<file>


    Если вы укажете - вместо имени файла, то URL будут читаться из стандартного ввода (stdin).

    Создать пятиуровневую копию сайта GNU со структурой папок оригинала, с одной попыткой загрузки, сохранить сообщения в gnulog:

            wget -r http://www.gnu.org/ -o gnulog




    Как и в примере выше, но с конвертированием ссылки в файлах HTML в локальные, для последующего автономного просмотра:

            wget --convert-links -r http://www.gnu.org/ -o gnulog




    Загрузить одну страницу HTML и все файлы, требуемые для отображения последней (напр. рисунки, файлы каскадных стилей и т. д.). Также сконвертировать все ссылки на эти файлы:

            wget -p --convert-links http://www.server.com/dir/page.html


    Страница HTML будет сохранена в www.server.com/dir/page.html и рисунки, каскадные стили и прочее будет сохранено в папке www.server.com/, кроме случая, когда файлы будут загружаться с других серверов.

    Как и в примере выше, но без папки www.server.com/. Также все файлы будут сохранены в подпапках download/.

            wget -p --convert-links -nH -nd -Pdownload \
                 http://www.server.com/dir/page.html



    Загрузить index.html с www.lycos.com, отображая заголовки сервера:

            wget -S http://www.lycos.com/



    Сохранить заголовки в файл для дальнейшего использования.

            wget -s http://www.lycos.com/
            more index.html


    Загрузить два высших уровня wuarchive.wustl.edu в /tmp.

            wget -r -l2 -P/tmp ftp://wuarchive.wustl.edu/


    Загрузить файлы GIF папки на HTTP сервере. Команда wget http://www.server.com/dir/*.gif не будет работать, так как маскировочные символы не поддерживаются при загрузке по протоколу HTTP. Используйте:

            wget -r -l1 --no-parent -A.gif http://www.server.com/dir/


    -r -l1 включает рекурсивную загрузку с максимальной глубиной 1. --no-parent выключает следование по ссылкам в родительскую папку, имеющую верхний уровень, -A.gif разрешает загружать только файлы с расширением .GIF. -A ``*.gif'' также будет работать.

    Предположим, что во время рекурсивной загрузки вам нужно было срочно выключить/перезагрузить компьютер. Чтобы не загружать уже имеющиеся файлы, используйте:

            wget -nc -r http://www.gnu.org/



    Если вы хотите указать имя пользователя и пароль для сервера HTTP или FTP, используйте соответствующий синтаксис URL:

            wget ftp://hniksic:mypassword@unix.server.com/.emacs



    Вы хотите, чтобы загружаемые документы шли в стандартный вывод, а не в файлы?

            wget -O - http://jagor.srce.hr/ http://www.srce.hr/


    Если вы хотите устроить конвейер и загрузить все сайты, ссылки на которые указаны на одной странице:

            wget -O - http://cool.list.com/ | wget --force-html -i -

plants