вопрос о роботе Яндекса

Статус
В этой теме нельзя размещать новые ответы.

deli6z

Создатель
Регистрация
31 Авг 2007
Сообщения
31
Реакции
1
есть сайт, ему не более 2 недель. на сайт ежедневно ходит робот Яндекса и вызывает непонятные мне страницы

83.222.5.171 - - [27/Jan/2009:15:59:38 +0200] "GET /cool.php/test907437940.html HTTP/1.0" 404 - "-" "Yandex/1.01.001 (compatible; Win16; I)"
83.222.5.171 - - [27/Jan/2009:15:59:40 +0200] "GET /cool.php?link_page=907437940 HTTP/1.0" 404 - "-" "Yandex/1.01.001 (compatible; Win16; I)"
83.222.5.171 - - [28/Jan/2009:20:25:41 +0200] "GET /cool.php/test480335620.html HTTP/1.0" 404 - "-" "Yandex/1.01.001 (compatible; Win16; I)"
83.222.5.171 - - [28/Jan/2009:20:25:44 +0200] "GET /cool.php?post480335620html HTTP/1.0" 404 - "-" "Yandex/1.01.001 (compatible; Win16; I)

и так каждый день
ни одной страницы сайта не скушал лишь проверяет выше указанные страницы
может кто нибудь в курсе происходящего?
 
А у тебя вообще подобные страницы то есть?
Хотьбы сайт засветил чтоль или просто написал что эта страница "cool.php" у меня есть. и что такие параметры к ней присутствуют/отсутствуют.

А так могу только одно сказать, что если при условии что страница cool.php есть а параметров, перечисленных тобой выше нет, то скорее всего яшка тестирует эту страницу на предмет типа "динамического дора" или возвращение сгенерированной страницы, по передаче скрипту в _GET любых параметров. При таком случае если яшка увидит разные страницы по своим тестам, то просто не будет их индексировать и возможно наложит какие нить фильтры на сам сайт.
 
А у тебя вообще подобные страницы то есть?
Хотьбы сайт засветил чтоль или просто написал что эта страница "cool.php" у меня есть. и что такие параметры к ней присутствуют/отсутствуют.

А так могу только одно сказать, что если при условии что страница cool.php есть а параметров, перечисленных тобой выше нет, то скорее всего яшка тестирует эту страницу на предмет типа "динамического дора" или возвращение сгенерированной страницы, по передаче скрипту в _GET любых параметров. При таком случае если яшка увидит разные страницы по своим тестам, то просто не будет их индексировать и возможно наложит какие нить фильтры на сам сайт.

никакой страницы cool.php нету!!!!! и не было..
 
покажите сайт сюда или, если не хотите светить, то в личку. так сложно что то конкретное сказать
 
Скорее всего левые боты что то сканируют маскируясь под Яндекс бота, или если сайт на сервере висит с оплачиваемым трафиком то хостер "помогает" побольше его использовать
 
Скорее всего левые боты что то сканируют маскируясь под Яндекс бота

Кстати где-то встречал список интересный где обсуждались SQL инъекции, так вот в этом списке помоему попадалась inurl: "cool.php?id=".
Вполне может быть что сайт ТС сканили на предмет возможности ченить в БД запихнуть нехорошее.
 
  • Заблокирован
  • #7
Наивный вопрос: домен новый? Просто, если домен был у кого-то в использовании, то в яше могли остаться старые беки - вот он их и обходит время от времени.
 
Наивный вопрос: домен новый? Просто, если домен был у кого-то в использовании, то в яше могли остаться старые беки - вот он их и обходит время от времени.

нет домен перехватил...ранее на нем был другой сайт..
что посоветуете сделать...восстанавливать старые страницы старого сайта по вебархиву? робот ни в какую новые не индексирует
 
что посоветуете сделать...восстанавливать старые страницы старого сайта по вебархиву? робот ни в какую новые не индексирует
Не надо восстанавливать. Лучше дождаться когда яндекс выкинет из базы старые страницы. Сделать карту сайта и обязательно скормить ее в панели вебмастера.
 
Не надо восстанавливать. Лучше дождаться когда яндекс выкинет из базы старые страницы. Сделать карту сайта и обязательно скормить ее в панели вебмастера.

ок сделаю.
еще одно, ничего что на сайте ссылки не ЧПУ?
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху