Как узнать "Поисковика"?

Статус
В этой теме нельзя размещать новые ответы.

Derag

Профессор
Регистрация
8 Ноя 2008
Сообщения
218
Реакции
45
Здравствуйте.
Я запамятовал, какая переменная показывает имя поиского робота?
Ну например Google Bot, Yandex Crawler.
 
Очередной отжиг :D
Нет такой переменной.

Читать Для просмотра ссылки Войди или Зарегистрируйся и вообще смотреть форум.
 
USER-AGENT

$_SERVER['HTTP_USER_AGENT']
 
С помощью strpos ищем совпадения в заголовке HTTP_USER_AGENT.
 
типа такого:

Код:
<?
$google = strpos($_SERVER['HTTP_USER_AGENT'], "Googlebot") !== false; 
$yandex = strpos($_SERVER['HTTP_USER_AGENT'], "Yandex") !== false; 
$rambler = strpos($_SERVER['HTTP_USER_AGENT'], "StackRambler") !== false; 
$aport = strpos($_SERVER['HTTP_USER_AGENT'], "Aport") !== false; 
$msn = strpos($_SERVER['HTTP_USER_AGENT'], "MSN") !== false; 
$yahoo = strpos($_SERVER['HTTP_USER_AGENT'], "Yahoo") !== false; 

if(!$google || !$yandex || !$rambler || !$aport || !$ msn || !$yahoo) echo "Это не бот";
?>
 
это если официальные нужны.
бывает, что боты и браузером представляются - тогда только по ip смотреть в специально заготовленные списки зон.
 
Не лишним будет добавить, что поисковики часто проверяют сайты/страницы на клоакинг и в случае чего банят. Фишка в том, что их не определишь никак. Ни по ЮзерАгенту, ни по диапазонам айпишников. Так что лучше не рисковать, если есть другой выход.
 
Не лишним будет добавить, что поисковики часто проверяют сайты/страницы на клоакинг и в случае чего банят.
Тоже об этом думал, но нигде не нашёл инфу, что такое бывает.
Я думаю можно будет поставить "большую" маску на IP поисковика(думаю достаточно Гугла и Яндекса).
И я не замечал в логах, что бы кто то прошёл у меня по всем страницам, кроме поисковика.
 
Какую "большую" маску?
Боты бегают с разных сетей и периодически их меняют.
 
Если мне память не изменяет, я видел где то базу айпи гугль ботов. Правда сейчас может она уже не актуальна, хотя может новую найдете.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху