Как спарсить жж?

Lexon

Постоялец
Регистрация
20 Фев 2008
Сообщения
113
Реакции
4
Помогите пожалуйста, никак не получается спарсить livejournal.com. Даже такой код не работает(((



Код:
<?php
 
function curl_get_file_contents($URL)
  {
      $c = curl_init();
      curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
      curl_setopt($c, CURLOPT_URL, $URL);
      $contents = curl_exec($c);
      curl_close($c);
 
      if ($contents) return $contents;
          else return FALSE;
  }
 
 
 
$content = curl_get_file_contents('http://www.yandex.ru/');
echo $content;
 
?>

Существует ли, какая- нибудь хитрая библиотека, которая бы выдавала скрипт за браузер, или что-то типо того. Очень нужна. ((
 
Тут глянь, аналогию Для просмотра ссылки Войди или Зарегистрируйся
Рабочий на 100%, сам проверял!

Простите, но в курле я совсем уж нуб, как бы не пытался что-то изменить, убрать добавить результат нулевой. Если это возможно, не могли бы вы подправить мой скрипт, чего-то в нём не хватает, только я всё никак не могу понять чего.
 
А что с курлом не получилось?
Там же вроде проще некуда.
PHP:
$ch = curl_init(); // Инициализируем сессию
    curl_setopt($ch, CURLOPT_URL,"http://ya.ru"); // задаем урл
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); // результат в переменную
    curl_setopt($ch, CURLOPT_COOKIEJAR, 'cookie.txt'); // файл для хранения кукисов, если нужно
    //Посылаем запрос
    $result = curl_exec($ch);
Нужная страничка сохранена в $result.
Далее чистим с помощью регулярок и всё:)
 
Многие страницы (в т.ч. тот же яндекс) можно спарсить через file_get_contents
 
  • Заблокирован
  • #7
Новую тему создавать не буду.
Как сделать на курле авторизацию к webmoney и возможно ли, СУТЬ!!!
Для просмотра ссылки Войди или Зарегистрируйся... нужно спарсить.

Если нет, на то и суда нет)))
 
Назад
Сверху