[curl] выдернуть хтмл страничку со всеми стилями и js

Тема в разделе "Как сделать...", создана пользователем dandandan, 11 мар 2012.

  1. dandandan

    dandandan

    Регистр.:
    7 авг 2008
    Сообщения:
    991
    Симпатии:
    267
    Встала задача выдергивать хтмл странички с сайтов вместе с таблицами стилей и js. Таблицы стилей и js могут быть отдельными прикрепляемыми файлами. Обычным курлом как я понимаю этого не сделать.

    Может есть какая-нибудь дополнительная надстройка над курлом или class, чтобы как в браузере при сохранении страницы сохранялись бы еще и таблицы стилей (и ява скрипты).
    Желательно все в одном текстовом документе. Браузеры не так делают.

    p.s. Как получить голую html страничку курлом я знаю.
     
  2. o_nix

    o_nix

    Регистр.:
    7 ноя 2007
    Сообщения:
    1.073
    Симпатии:
    1.037
    на счёт curl не знаю - скорее всего никак кроме скачивания html выпарсивания ссылок на весь остальной контент и опять скачивание

    как на счёт wget ?

    в нём всего один параметр добавляеш и всё сразу скачивается
    примерно так
    Код:
    wget -p http://site.ru/
    параметр p - заставляет выкачивать все img csv js и тп

    из php запускать wget через exec
     
  3. autos

    autos

    Регистр.:
    14 июл 2007
    Сообщения:
    191
    Симпатии:
    49
    надо парсить скаченный html текст на присутствие файлов js, css и тоже их скачивать через curl.
     
  4. dandandan

    dandandan

    Регистр.:
    7 авг 2008
    Сообщения:
    991
    Симпатии:
    267
    Так может уже кто-то такое писал. Вот и спрашиваю.