Серверный парсер сниппетов гугла

Тема в разделе "Коммерческие", создана пользователем dig555, 6 июн 2008.

Информация :
Публиковать (для всех) нуленые версии, особенно от modulesgarden КАТЕГОРИЧЕСКИ не стоит. Тема мониторится оным разработчиком, а к нам приходят абузы которые нельзя игнорировать.
Статус темы:
Закрыта.
Модераторы: Amazko, Aste
  1. dig555

    dig555

    Регистр.:
    22 июн 2007
    Сообщения:
    362
    Симпатии:
    148
    Ищу серверный парсер сниппета гугла. Поделитесь, пожалуйста, у кого есть:bc:

    Нашёл сам. Топик можно снести.
    PHP:
    <?php 

            $kwd 
    "buy car"
            
    $num=100
              
            
    //******    ШАГ №1. ПОЛУЧАЮ ВЫДАЧУ ГУГЛА *****************************************************************************************  
            
    $url "http://www.google.ru/search?q=".str_replace(' ','+',$kwd)."&hl=en&num=$num&lr=lang_en";  
                      
            
    $ch curl_init();  
            
    curl_setopt($chCURLOPT_COOKIEJAR'C:/apache/localhost/www/Doorgen/cookie.txt');  
            
    curl_setopt($chCURLOPT_COOKIEFILE'C:/apache/localhost/www/Doorgen/cookie.txt');  
            
    curl_setopt($chCURLOPT_URL$url);  
            
    curl_setopt($chCURLOPT_HEADER1);  
            
    curl_setopt($chCURLOPT_NOBODY0);  
            
    curl_setopt($chCURLOPT_RETURNTRANSFER1);  
            
    curl_setopt($chCURLOPT_SSL_VERIFYPEER0);  
            
    curl_setopt($chCURLOPT_TIMEOUT180);  
            
    curl_setopt($chCURLOPT_REFERER'http://google.com/');  
            
    curl_setopt($chCURLOPT_FOLLOWLOCATION1);  
            
    curl_setopt($chCURLOPT_USERAGENT"Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)");   
            
    $result curl_exec($ch);      
            
    curl_close($ch);  
            
    //*******************************************************************************************************************************  
              
            //echo $result;  
            
    $result str_replace("\"j hc\"","\"j\"",$result);  
              
            
    $resnum preg_match_all("~'\)\">(.*)</a></h2>~Uis",$result,$_titles);  
            
    $resnum1 preg_match_all("~<td class=\"j\">(.*)<br>~Uis",$result,$_snippets);  
            
    $resnum2 preg_match_all("~<h2 class=r><a href=\"(.*)\" target=_blank class=l~Uis",$result,$_links);  
              
            echo 
    "<br><font class=tval><b>Количество результатов</b></font> = $resnum <br>";          
            for(
    $i=0;$i<$resnum;$i++)  
            {  
                
    $title strip_tagstrim$_titles[1][$i] ) );  
                
    $snippet strip_tagstrim$_snippets[1][$i] ) );  
                
    $link strip_tagstrim$_links[1][$i] ) );  
                  
                
    //echo "<b>Title ".($i+1).":</b>  $title<br>";  
                //echo "<b>Snippet ".($i+1).":</b>  $snippet<br>";  
                //echo "<b>Link ".($i+1).":</b>  $link<br>";  
                  
                
    $snippet str_replace(", ...",". ",$snippet);              
                
    $snippet str_replace(" ...",". ",$snippet);              
                
    $snippet str_replace("..",".",$snippet);              
                
    $snippet $snippet." ";  
                  
                
    $txtnum preg_match_all("~[A-Z]([a-z])+ ([A-Za-z ,;'&0-9$-])*(\.|\?|!) ~Uis",$snippet,$_text);  
                  
                
    $snippettext "";  
                  
                for(
    $j=0;$j<$txtnum;$j++)  
                {  
                    
    $_text[0][$j][0] = strtoupper$_text[0][$j][0] );  
                      
                    if (
    strlen($_text[0][$j]) > 50)                      
                        
    $snippettext $snippettext.trim($_text[0][$j])."\r\n";  
                }  
                
    $snippettext str_replace("'","'",$snippettext);  
                
    $snippettext str_replace("&amp;","&",$snippettext);  
                
    $snippettext str_replace("&middot;","",$snippettext);  
                
    $snippettext str_replace("&quot;","'",$snippettext);      
                
    $snippettext str_replace("&gt;","",$snippettext);      
                
    $snippettext str_replace("...",".",$snippettext);  
                
    $snippettext str_replace("..",".",$snippettext);  
                
    $snippettext str_replace(".,",".",$snippettext);  
                
    //exit();  
                //echo $snippettext;  
                //echo "<br><Br>";  
                  
                
    $RESULTS[$i]['title'] = $title;  
                
    $RESULTS[$i]['snippet'] = $snippet;  
                
    $RESULTS[$i]['link'] = $link;  
                
    $RESULTS[$i]['snippettext'] = $snippettext;  
                echo 
    "<b>title</b>: ".$title."<br>"
                echo 
    "<b>snippet</b>: ".$snippet."<br>"
                echo 
    "<b>link</b>: ".$link."<br>"
                echo 
    "<b>snippettext</b>: ".$snippettext."<br><br>"
            }   
             

    ?>
     
Статус темы:
Закрыта.