wordstat показывает капчу курлу

Тема в разделе "PHP", создана пользователем phillip, 8 фев 2010.

Статус темы:
Закрыта.
Модераторы: latteo
  1. phillip

    phillip

    Регистр.:
    4 сен 2007
    Сообщения:
    413
    Симпатии:
    15
    Хочу парсить wordstat.yandex курлом. Показывает капчу( как быть? где недоработка?
    PHP:
    <?php
    ini_set
    ('display_errors',1);  error_reporting(E_ALL); 
    set_time_limit(0);

      
    $agent 'Mozilla/5.0 (Windows; U; Windows NT 5.1; ru-RU; rv:1.7.12) Gecko/20050919 Firefox/1.0.7'
      
    $header[] = "Accept: text/html;q=0.9, text/plain;q=0.8, image/png, */*;q=0.5" 
      
    $header[] = "Accept_charset: windows-1251, utf-8, utf-16;q=0.6, *;q=0.1"
      
    $header[] = "Accept_encoding: identity"
      
    $header[] = "Accept_language: en-us,en;q=0.5"
      
    $header[] = "Connection: close"
      
    $header[] = "Cache-Control: no-store, no-cache, must-revalidate"
      
    $header[] = "Keep_alive: 300"
      
    $header[] = "Expires: Thu, 01 Jan 1970 00:00:01 GMT"

        
    $url='http://wordstat.yandex.ru';
      
    $ch curl_init();  
      
    curl_setopt($chCURLOPT_URL,$url);  
      
    curl_setopt($chCURLOPT_HEADER1); 
      
    curl_setopt($chCURLOPT_FOLLOWLOCATION1); 
      
    curl_setopt($chCURLOPT_RETURNTRANSFER,1);  
      
    curl_setopt($chCURLOPT_TIMEOUT30); 
      
    curl_setopt ($chCURLOPT_SSL_VERIFYPEERFALSE);  
      
    curl_setopt($chCURLOPT_POST1); 
      
    curl_setopt $ch CURLOPT_USERAGENT $agent); 
      
    curl_setopt $ch CURLOPT_HTTPHEADER $header); 
      
    curl_setopt($chCURLOPT_COOKIEJAR'cookie.txt'); 
      
    curl_setopt($chCURLOPT_COOKIEFILE'cookie.txt'); 
      
    $text curl_exec($ch); 
      
    curl_close($ch);    
      
      echo 
    $text;
    ?>
     
  2. Alix

    Alix

    Регистр.:
    27 янв 2008
    Сообщения:
    234
    Симпатии:
    84
    Если каптча вылазит не из-за того, что часто дергаешь, а в связи с последними изменениями - то надо лезть с уже установленной кукой. Делаем запрос на http://kiks.yandex.ru/su/, сохраняем куки в файл - и уже с ними на амбразуру вордстата.
     
    krobol и phillip нравится это.
  3. serjinio

    serjinio

    Регистр.:
    10 май 2007
    Сообщения:
    439
    Симпатии:
    49
    Для того чтобы получить ответы ,надо смотреть заголовки общения браузера и сайта ,и такиеже отдавать скриптом ,для этого есть много инструментов ,хорошиу плагин для FF LiveHTTPHeaders
     
  4. satih

    satih

    Регистр.:
    19 сен 2008
    Сообщения:
    429
    Симпатии:
    710
    А если каптчу получаю из-за того что часто дергаю? Пробовал отсылать им ответ с решением каптчи, похожий на тот что ловил снифером при отправке браузером, не сработало.
     
  5. Sanuch

    Sanuch

    Регистр.:
    25 май 2009
    Сообщения:
    207
    Симпатии:
    70
    тогда использовать сервисы для распознования каптчи
     
  6. pk2002

    pk2002

    Регистр.:
    14 ноя 2006
    Сообщения:
    382
    Симпатии:
    350
    Однозначно нужно капу отправлять на распознавание или увелеичить временной интервал между запросами чтоб капча не выскакивала
     
Статус темы:
Закрыта.