Как найти откуда идет мертвая внутренняя ссылка

Тема в разделе "Вопросы новичков", создана пользователем BBA1978, 15 сен 2008.

Статус темы:
Закрыта.
  1. BBA1978

    BBA1978 Постоялец

    Регистр.:
    1 сен 2008
    Сообщения:
    103
    Симпатии:
    7
    Господа, может быть туплю - тогда прошу меня извинить:
    Гугл пишет что у него в индексе несколько моих битых страниц. Смотрю на адреса страниц в сводке ошибок гугла - етих страниц банально нет на сайте вообще. Но я не могу найти с из какого места гугл берет на них ссылку. Попробовал сделать сайтмап - та же история, в сайтмапе они тоже указаны - значит гдето в тексте страниц есть реально неправильные внутренние ссылки. НО МНЕ ИХ НЕ НАЙТИ - сайт больше 5000 страниц. Есть какой-нибудь метод поиска тих битых ссылок??? В яше блин та же катрина, и я так понимаю для продвижения то важно :( Прошу помочь новичку
     
  2. intel

    intel

    Регистр.:
    18 сен 2007
    Сообщения:
    190
    Симпатии:
    14
    http://www.semonitor.ru/positioning_features.html Semonitor
     
  3. funnyinmymind

    funnyinmymind Создатель

    Регистр.:
    19 дек 2007
    Сообщения:
    33
    Симпатии:
    3
    ага, сталкивался с таким.
    Самое хреновое, что это легко может быть ВНЕШНЯЯ ССЫЛКА. в каком-нибудь Squid отчете у какого-нить провайдера в открытом доступе висит годами что такого -то года пользователь зашел на такую-то страницу. И пусть этой страницы уже давно нет на сервере, а ссылка на нее все равно висит в логе в свободном доступе,
    например http://www.avtoros.ck.ua/01Nov2007-30Nov2007/192.168.3.152/192.168.3.152.html
    или http://dr.zaural.ru/sarg/15Jan2008-15Jan2008/192_168_1_167/192_168_1_167.html
    и пауки ее индексят..
     
  4. zerdek

    zerdek

    Регистр.:
    29 ноя 2007
    Сообщения:
    346
    Симпатии:
    50
    немного не в тему... иногда свои сайты проверяю на ошибки, на правильный ЧПУ и на 404, 500 и т.д. - при помощи зеркалирования, а потом смотрю что скачалось и гляжу в лог.
    проще всего делать это консольным wget-ом, запускаю его прямо на сервере, чтобы лишний траф не гонять.
     
  5. porsche2

    porsche2

    Регистр.:
    18 ноя 2007
    Сообщения:
    667
    Симпатии:
    210
    Попробуй в Google вбить site:site.com битая_ссылка.html

    еще можно выкачать весь сайт качалкой типо TeleportPRo, и искать в текстах документов.
     
  6. BBA1978

    BBA1978 Постоялец

    Регистр.:
    1 сен 2008
    Сообщения:
    103
    Симпатии:
    7
    Да, действительно ступил, надо скачать сайт на диск и найти вхождение текста в файлы ... Всем большое спасибо.

    А по поводу мертвых ссылок с провайдера - с таким еще не сталкивался, интересный пример - проверю.
     
  7. BBA1978

    BBA1978 Постоялец

    Регистр.:
    1 сен 2008
    Сообщения:
    103
    Симпатии:
    7
    Не пашет, этот запрос работает на текстовый - не на ссылочный контент
     
  8. kikimora17

    kikimora17 Постоялец

    Регистр.:
    15 дек 2007
    Сообщения:
    62
    Симпатии:
    41
    битые ссылки и мёртвые страницы

    Убитые ссылки и мёртвые страницы можно собрать и посмотреть на панели Я.вебмастера (сам так чищу сайты периодически)
     
  9. BBA1978

    BBA1978 Постоялец

    Регистр.:
    1 сен 2008
    Сообщения:
    103
    Симпатии:
    7
    Я там их и смотрю - но загадка состоит в том, что не понятно ОТКУДА НА МЕРТВУЮ СТРАНИЦУ САЙТА ИДЕТ ВНУТРЕННЯЯ ССЫЛКА - С КАКОЙ СТРАНИЦЫ ИЛИ СТРАНИЦ. Вопрос то был в этом.

    Кстати, SEMonitor именно выявить откуда на мертвяка идет ссылка не позволяет - действительно пока единственный найденный способ - это качнуть сайт к себе на диск, причем не в виде PHP естественно - а типа простой выкачивалкой сайтов по HTML, и устроить поиск по вхождению текста в файлы.
     
  10. Fast3r

    Fast3r

    Регистр.:
    30 июн 2008
    Сообщения:
    329
    Симпатии:
    39
    у Дримвивера есть стандартная функция проверки ссылок и ресурсов в проэкте.
     
Статус темы:
Закрыта.