Как спарсить жж?

Тема в разделе "Как сделать...", создана пользователем Lexon, 30 янв 2012.

  1. Lexon

    Lexon Постоялец

    Регистр.:
    20 фев 2008
    Сообщения:
    114
    Симпатии:
    4
    Помогите пожалуйста, никак не получается спарсить livejournal.com. Даже такой код не работает(((



    Код:
    <?php
     
    function curl_get_file_contents($URL)
      {
          $c = curl_init();
          curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
          curl_setopt($c, CURLOPT_URL, $URL);
          $contents = curl_exec($c);
          curl_close($c);
     
          if ($contents) return $contents;
              else return FALSE;
      }
     
     
     
    $content = curl_get_file_contents('http://www.yandex.ru/');
    echo $content;
     
    ?>
    Существует ли, какая- нибудь хитрая библиотека, которая бы выдавала скрипт за браузер, или что-то типо того. Очень нужна. ((
     
  2. Дмитрий Кесаев

    Дмитрий Кесаев aka Zlobniy Babko

    Заблокирован
    Регистр.:
    10 май 2007
    Сообщения:
    1.332
    Симпатии:
    1.266
    Lexon нравится это.
  3. Lexon

    Lexon Постоялец

    Регистр.:
    20 фев 2008
    Сообщения:
    114
    Симпатии:
    4
    Простите, но в курле я совсем уж нуб, как бы не пытался что-то изменить, убрать добавить результат нулевой. Если это возможно, не могли бы вы подправить мой скрипт, чего-то в нём не хватает, только я всё никак не могу понять чего.
     
  4. Lexon

    Lexon Постоялец

    Регистр.:
    20 фев 2008
    Сообщения:
    114
    Симпатии:
    4
  5. ghisool

    ghisool Писатель

    Регистр.:
    31 янв 2012
    Сообщения:
    1
    Симпатии:
    0
    А что с курлом не получилось?
    Там же вроде проще некуда.
    PHP:
    $ch curl_init(); // Инициализируем сессию
        
    curl_setopt($chCURLOPT_URL,"http://ya.ru"); // задаем урл
        
    curl_setopt($chCURLOPT_RETURNTRANSFER1); // результат в переменную
        
    curl_setopt($chCURLOPT_COOKIEJAR'cookie.txt'); // файл для хранения кукисов, если нужно
        //Посылаем запрос
        
    $result curl_exec($ch);
    Нужная страничка сохранена в $result.
    Далее чистим с помощью регулярок и всё:)
     
  6. gothmog

    gothmog Постоялец

    Регистр.:
    18 июн 2011
    Сообщения:
    60
    Симпатии:
    24
    Многие страницы (в т.ч. тот же яндекс) можно спарсить через file_get_contents
     
  7. Дмитрий Кесаев

    Дмитрий Кесаев aka Zlobniy Babko

    Заблокирован
    Регистр.:
    10 май 2007
    Сообщения:
    1.332
    Симпатии:
    1.266
    Новую тему создавать не буду.
    Как сделать на курле авторизацию к webmoney и возможно ли, СУТЬ!!!
    Перейти по ссылке... нужно спарсить.

    Если нет, на то и суда нет)))