[Решено] Выдрать ссылку из javascript

Тема в разделе "PHP", создана пользователем TIIIMOXAN, 2 сен 2015.

Статус темы:
Закрыта.
Модераторы: latteo
  1. TIIIMOXAN

    TIIIMOXAN

    Регистр.:
    1 сен 2009
    Сообщения:
    403
    Симпатии:
    65
    Приветствую!

    Помогите, пожалуйста, получить ссылку из javascript.

    Есть страница:


    С нее необходимо получить ссылку на скачивание pdf файла, которая скрыта в javascript.

    Для моих целей лучше всего будет: сохранить html-код страницы на локальный компьютер или сервер по ссылке, к примеру ту, что указал выше (таких просто будет много), и потом уже тем же Content Downloader распарсить html-страницу в процессе его работы.

    Я использую скрипт (взял отсюда) , для получения страницы:

    PHP:
    <?
       
    $ch curl_init (); // инициализация
       
    curl_setopt ($ch CURLOPT_URL "http://mnogo-dok.ru/instrukcii/sendvalues/2101/%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BD%D0%B0%D1%8F/%D0%9A%D0%9F%D0%9A+%D0%B8+%D0%BA%D0%BE%D0%BC%D0%BC%D1%83%D0%BD%D0%B8%D0%BA%D0%B0%D1%82%D0%BE%D1%80%D1%8B/Acer/AS+ONE+A150+Blue/");
       
    curl_setopt ($ch CURLOPT_USERAGENT "Mozilla/5.0"); // каким браузером будем прикидываться
       
    curl_setopt ($ch CURLOPT_RETURNTRANSFER ); // вывод страницы в переменную
       
    $content curl_exec($ch); // скачиваем страницу
       
    curl_close($ch); // закрываем соединение
      
    echo $content;
    ?>
    но данный скрипт передает только html-код страницы, соответственно ссылка остается скрытой.

    Поэтому вопрос, можно ли средствами php извлечь ссылку из javascript и передать ее в html для дальнейшей работы?

    На просторах интернета нашел несколько вариантов:

    HTML:
    https://github.com/scraperlab/browserext/blob/master/README-RU.md
    https://code.google.com/p/phpquery/
    https://github.com/hxseven/htmlSQL
    http://simplehtmldom.sourceforge.net/manual.htm
    http://timwhitlock.info/blog/2009/11/jparser-and-jtokenizer-released/
    Но фиг его знает что с ними делать, т.к. в данной области не селен.

    Заранее благодарю за помощь!
     
    latteo нравится это.
  2. latteo

    latteo Эффективное использование PHP, MySQL

    Moderator
    Регистр.:
    28 фев 2008
    Сообщения:
    1.450
    Симпатии:
    1.244
    Из всего этого многообразия только https://github.com/scraperlab/browserext является более менее современной разработкой и cможет запустить JS.
     
    TIIIMOXAN и Denixxx нравится это.
Статус темы:
Закрыта.