как определить на какой из моих сайтов робот заходит чаще

Тема в разделе "Вопросы новичков", создана пользователем sympler, 17 май 2010.

Статус темы:
Закрыта.
  1. sympler

    sympler Постоялец

    Регистр.:
    24 окт 2008
    Сообщения:
    131
    Симпатии:
    6
    Добрый день. Есть у меня несколько сайтов, абсолютно разной тематики и размеров от 5 страниц до 10000. Хотелось узнать на какой из сайтов робот чаще заходит, хотябы предположительно?

    Думаю на тот сайт который чаще обновляется и выглядит как сдл?
     
  2. Delk0

    Delk0

    Регистр.:
    26 мар 2010
    Сообщения:
    284
    Симпатии:
    47
    Думаю лучше не гадать а в логи апача смотреть.
     
  3. CrashX

    CrashX В прошлом XSiteCMS

    Регистр.:
    6 июн 2008
    Сообщения:
    682
    Симпатии:
    112
    напиши свой небольшой счетчик и фиксируй их)) я раньше так делал))
    Пример

    PHP:
    /**
       * Браузер
       * @return  mixed браузер, бот или false если не определен
       */
      
    function browser() {
        global 
    $HTTP_USER_AGENT;
        if(empty(
    $HTTP_USER_AGENT)):
          if(!empty(
    $_SERVER) && isset($_SERVER['HTTP_USER_AGENT'])): $HTTP_USER_AGENT=$_SERVER['HTTP_USER_AGENT'];
          elseif(@
    getenv('HTTP_USER_AGENT')): $HTTP_USER_AGENT=getenv('HTTP_USER_AGENT');
          endif;
        endif;
        
    $browser=array(
                
    // браузеры
                
    "msie"=>"Internet Explorer",
                
    "opera"=>"Opera","mozilla"=>"Mozilla",
                
    "firebird"=>"Mozilla Firebird",
                
    "firefox"=>"Mozilla Firefox",
                
    "go!zilla"=>"Go!Zilla","konqueror"=>"Konqueror",
                
    "teleport"=>"TelePort Pro",
                
    "webcapture"=>"Acrobat",
                
    "webcopier"=>"WebCopier",
    // телефоны
                
    "alcatel"=>"Alcatel Browser (PDA/Phone browser)",
                
    "mot-"=>"Motorola Browser (PDA/Phone browser)",
                
    "nokia"=>"Nokia Browser (PDA/Phone browser)","panasonic"=>"Panasonic Browser (PDA/Phone browser)",
                
    "philips"=>"Philips Browser (PDA/Phone browser)","sonyericsson"=>"Sony/Ericsson Browser (PDA/Phone browser)",
                
    "docomo"=>"I-Mode phone (PDA/Phone browser)","portalmmm"=>"I-Mode phone (PDA/Phone browser)",
    // валидаторы
                
    "csscheck"=>"WDG CSS Validator",
                
    "w3m"=>"W3M Validator",
                
    "w3c_css_validator"=>"W3C CSS Validator",
                
    "w3c_validator"=>"W3C HTML Validator",
                
    "wdg_validator"=>"WDG HTML Validator",
    // поисковики
                
    "Yandex"=>"Yandex",
                
    "google"=>"Google",
                
    "Googlebot"=>"Google",
                
    "Mediapartners-Google"=>"Google",
                
    "StackRambler"=>"Rambler",
                
    "stack"=>"Rambler",
                
    "rambler"=>"Rambler",
                
    "Mail.Ru"=>"Mail.Ru",
                
    "meta"=>"Meta",
                
    "fast"=>"Fast",
                
    "aport"=>"Aport",
                
    "yahoo"=>"Yahoo",
                
    "Yahoo-MMCrawler"=>"Yahoo",
                
    "lycos"=>"Lycos",
                
    "MSNBot"=>"MNS\Live",
                
    "Teoma"=>"ASK",
                
    "ia_archiver"=>"Alexa",
                
    "Crawler/2.0"=>"WebAlta",
                
    "Slurp"=>"Slurp",
                
    "Wget"=>"Wget",
                
    "WebCrawler"=>"WebCrawler",
                
    "ZyBorg"=>"ZyBorg",
                
    "scooter"=>"AltaVista",
        );
        if(
    preg_match("/msie[\/\sa-z]*([\d\.]*)/i",$HTTP_USER_AGENT,$matches) && !preg_match("/webtv/i",$HTTP_USER_AGENT) && !preg_match("/opera/i",$HTTP_USER_AGENT)): return "Internet Explorer ".$matches[1];
        elseif(
    preg_match("/netscape.?\/([\d\.]*)/i",$HTTP_USER_AGENT,$matches)): return "Netscape ".$matches[1];
        elseif(
    preg_match("/mozilla[\/\sa-z]*([\d\.]*)/i",$HTTP_USER_AGENT,$matches) && !preg_match("/compatible/i",$HTTP_USER_AGENT) && !preg_match("/opera/i",$HTTP_USER_AGENT)): return "Netscape ".$matches[2];
        else:
          foreach(
    $browser as $key=>$string):
            if(
    preg_match("/$key.?\/([\d\.]*)/i",$HTTP_USER_AGENT,$matches)): return $browser[$key]." ".$matches[1];
            endif;
          endforeach;
        endif;
        return 
    $HTTP_USER_AGENT;
      }
    как использовать можно либо в фаил писать либо в базу это уже на выбор)) например в xml а потом с n сайтов их грузить и потом делать диаграммы...
     
  4. st34vlz

    st34vlz Постоялец

    Регистр.:
    25 апр 2008
    Сообщения:
    66
    Симпатии:
    13
    Web Log Explorer - анализ логов сервера
    http://www.nulled.ws/showthread.php?t=1584
     
  5. igor-force

    igor-force Создатель

    Регистр.:
    4 авг 2007
    Сообщения:
    15
    Симпатии:
    0
    Во первых какой именно робот? Яндекса? googla-f?
    Во вторых можно поставить на сайт вебмастер яндекс или goole там будет все указано
     
  6. sympler

    sympler Постоялец

    Регистр.:
    24 окт 2008
    Сообщения:
    131
    Симпатии:
    6
    интересуют роботы яндекса, если на какой то сайт по каким то причинам заходят каждую неделю а на какие то раз в месяц, думаю поставить на него ссылку и может будет чаще индексироваться?
     
Статус темы:
Закрыта.