Парсер картинок google (PHP)

Тема в разделе "Мелочи", создана пользователем Dali, 24 ноя 2010.

Статус темы:
Закрыта.
  1. Dali

    Dali

    Регистр.:
    7 апр 2006
    Сообщения:
    155
    Симпатии:
    153
    Собсно надо выпасить урлы картинок из гугла, так как у нас нечего толкового не нашел пришлось обратится к гуглу :D. Решил поделится:) изысканиями:

    PHP:
    <?php
    set_time_limit
    (0);
     
     
     function 
    read($path)
    {
       
    $file=fopen($path,"r");
       
    $bufer fread($file,filesize($path));
       
    fclose($file);
       return(
    $bufer);
    }
     
     function 
    add($path,$page_body)
    {
       
    $file=fopen($path,"a+");
     
    fputs($file,$page_body);
       
    fclose($file);
    }
     
     function 
    write($path,$page_body)
    {
       
    $file=fopen($path,"w");
     
    fwrite($file,$page_body);
       
    fclose($file);
    }
     
    $zaprosfile 'zapros.txt';//файл с запросами
    $ssilkifile 'ssilki.txt';//файл с урлами картинок
     
    $zapros read($zaprosfile);
    $sleep 3;//Задержка между парсингом (сек)
    $glub 1000;//Глубина парсинга (скоко картинок парсить по запросу)
     
    $zapros explode("\r\n"$zapros);
    $count count($zapros);
     
    for(
    $a=0$a<$count$a++)
    {
    for(
    $b=0;$b<$glub;)
    {
    $result file_get_contents('http://images.google.com/images?hl=ru&imgsz=l&imgtbs=z&as_st=y&q='.urlencode($zapros[$a]).'&sa=N&start='.$b.'&ndsp=20');
     
    preg_match_all("#imgurl(.*)x26#iU",$result,$ssilki);
     
    for(
    $c=0;$c<count($ssilki[1]);$c++)
    {
    $ssilka $ssilki[1][$c];
    $ssilka str_replace("\\x3d",'',$ssilka);
    $ssilka str_replace("\\",'',$ssilka);
    add($ssilkifile,$ssilka."\r\n");
    }
    $b=$b+10;
     
    sleep($sleep);
    }
     
    unset(
    $zapros[$a]);
    $zapis implode("\r\n",$zapros);
    write($zaprosfile,$zapis);
    }
    ?>

    З.Ы. Скрипт, выполнил поставленную задачу на УРА!
     
    MoroBoro и ReduKTOR нравится это.
  2. DenisK

    DenisK

    Регистр.:
    8 фев 2007
    Сообщения:
    206
    Симпатии:
    14
    А разве гугл не отслеживает роботов и не предлагает им капчу?
     
  3. DR.GROZNII

    DR.GROZNII Создатель

    Регистр.:
    6 апр 2009
    Сообщения:
    30
    Симпатии:
    2
    http://code.google.com/intl/ru-RU/more/ и тутможно посмотреть http://habrahabr.ru/blogs/google/25950/ через api все можно сделать поиск картинок=)
     
Статус темы:
Закрыта.