[Ищу] Определение тематики сайта

Тема в разделе "SEO Скрипты", создана пользователем Menro, 21 окт 2011.

  1. Menro

    Menro web, seo, email, hack

    Регистр.:
    27 янв 2008
    Сообщения:
    599
    Симпатии:
    112
    Добрый день!

    Люди, вот собрался искать исполнителя для скрипта/программы, главной задачей которого должно стать определение тематики сайта. Перед тем как создавать тему, опробовал множество сервисов, но к сожалению не один из них не дал хорошего результата, а именно из 10 сайтов, только 2 определяются верно.

    Связи с этим вопрос:

    Есть у кого какие соображения? Помимо анализа текста, откуда можно брать данные?

    Мои соображения:

    1.Анализ текста главной страницы на предмет часто встречающихся слов
    2.Парсинг сайтов из Liveinternet
    3.Парсинг сайтов из Rambler TOP 100
    4.Парсинг сайтов из каталога Mail.ru
    5.Парсинг сайтов из каталога Aport.ru
    6.Парсинг сайтов из более или менее популярных каталогов, например vsego.ru
    7.Нахождение ключевого слова в имени домена
    8.Передача данных из Яндекс.Каталог
    9.Передача данных из каталога DMOZ
    10.Анализ заголовков title
    12.Анализ meta keywords

    В добавок определение типа ресурса:

    1.Анализ сайта на предмет ссылок типа "О компании", "Схема проезда" - коммерческий
    2.Анализ сайта на предмет ссылок типа "Реклама на сайте" "Последние новости" и т.д - новостной