какой размер текста индексируют поисковики(статья)

Тема в разделе "Зарубежные поисковики", создана пользователем olllg, 23 апр 2008.

Статус темы:
Закрыта.
  1. olllg

    olllg

    Регистр.:
    17 фев 2007
    Сообщения:
    304
    Симпатии:
    141
    нарыто в инете
    Там, где останавливаются боты(из закладок)
    Сообщество SEO’шников славится множеством различных мнений относительно обьема текста, индексируемого поисками на единичной web-странице.

    Вопрос в том, насколько большой должна быть оптимизированая страница и где баланс между “слишком маленькой” страницей, которую поисковики сочтут неинформативной, и “слишком большой” страницей, на которой потенциально важный контент может остаться без внимания поисковиков? Насколько я знаю, еще никто не пытался ответить на этот вопрос с помощью собственного эксперимента.

    Участники SEO форумов обычно ограничиваются цитированием рекоммендаций, опубликованых самими поисковиками. До сих пор святая уверенность SEO сообщества в то, что лидирующие поисковики ограничивают объем индексируемого текста пресловутой сотней килобайт, заставляет их клиентов чесать голову в попытках понять что делать с текстом, который выходит за эти рамки.

    Эксперимент

    Когда я решил поставить эксперимент, чтобы ответить на этот вопрос опытным путем, моими целями были:

    Определить объем текста на странице, фактически индексируемого и кешируемого поисковиками.
    Вычислить объем индексируемого текста, в зависимости от общего размера страницы.
    Вот как проходил эксперимент. Я взял 25 страниц различного размера (от 45кб до 4151кб), ввел уникальные, несуществующие ключевые слова на каждую страницу с интервалами в 10кб (приблизительно через каждые 10000 символов (прим.пер.)). Ключевые слова генерировались автоматически, специально для эксперимента, и служили метками глубины индексации. Затем страницы были опубликованы, и я пошел сделать себе кофе, ибо ожидание прихода поисковиков обещало быть долгим....
    читать далее и смотреть диаграммы здесь http://emlm.ru/index.php?newsid=32
     
    Sandokan, masterlak и elchegevara нравится это.
  2. dos03

    dos03 -----

    Регистр.:
    9 мар 2007
    Сообщения:
    871
    Симпатии:
    428
    Вот что жалко, что всего три поисковика :-]
    Яшу бы не помешало проверить по этой теме. :-]

    Выводы конечно, нужно детальнее проанализировать. Но по гуглу, примерно такая цифра и называлась.
    Реально, не особо много страниц весом в метр, как у МСН.
     
  3. Levitt

    Levitt

    Регистр.:
    20 май 2008
    Сообщения:
    358
    Симпатии:
    36
    странно, у меня гугля на инфосторе схавала текст на 900 кБ..
    + бот и тамуд в формате пдф может сьесть
     
  4. General Fizz

    General Fizz Боевой Генерал :)

    Регистр.:
    11 апр 2007
    Сообщения:
    753
    Симпатии:
    396
    Может и больше схавать, но Гугля, если мне не изменяет память, учитывает только первые 200 кБ странички..
     
  5. willie

    willie Писатель

    Регистр.:
    14 янв 2008
    Сообщения:
    4
    Симпатии:
    1
    После 200 лб Гугл не индексирует, хотя саму страницу в выдачу помещает.
     
  6. Petya

    Petya Постоялец

    Регистр.:
    9 апр 2006
    Сообщения:
    92
    Симпатии:
    6
    willie
    кстати, очень интересная тема,
    на своем опыте видел сайты, которые гугл хавал по 1 мб на страницу.

    только вот индексирует, но ссылки часто оттуда не учитывает.
    были примеры сайтов с пр8 и пр7 где специально сделали помойку...
     
  7. werner2

    werner2

    Регистр.:
    22 май 2008
    Сообщения:
    180
    Симпатии:
    10
    По моим данным размер странички не должен превышать 500кб, если перед самим текстом попадется какой-нибудь флэш на несколько мегабайт, то тогда скорее всего и сам текст не проиндексируется.
     
  8. Levitt

    Levitt

    Регистр.:
    20 май 2008
    Сообщения:
    358
    Симпатии:
    36
    ошибаетесь.. есть у меня сайтик в шапке которого флеша на 700 кБ.
    вот только что загуглил случайнеую фразу с текста.. все находит
     
  9. iiii

    iiii Читатель

    Заблокирован
    Регистр.:
    14 июн 2008
    Сообщения:
    21
    Симпатии:
    0
    ИМХО.не совсем корректный эксперимент ,тут много зависит от контекста и сцылок ,у меня была страничка почти 1 метр - типа магазина с товаром и прекрасно и быстро проиндексилась .Просто Гугля понимает ИМХО что это такое ... типа дор ,линкопомойка или белое и пушистое :D
     
  10. shuffle

    shuffle Постоялец

    Регистр.:
    30 май 2008
    Сообщения:
    87
    Симпатии:
    21


    это мягко говоря бред, потому что ХМТЛ файл и флешка/картинки которая там в шапке это два разных объекта. Надо мерить не вес всей страницы, а вес только ХТМЛ кода страницы.
    Гугл такого кода может съесть много, несколько мегабайт, но контент находящийся выше будет иметь бОльший вес (теоритически).
     
Статус темы:
Закрыта.