SEO: Поисковые алгоритмы и фильтры

Тема в разделе "Поисковые машины", создана пользователем Darkness, 8 май 2014.

Статус темы:
Закрыта.
Модераторы: jabbaxatt, Sorcus
  1. Darkness

    Darkness Постоялец

    Регистр.:
    21 янв 2013
    Сообщения:
    146
    Симпатии:
    69
    Алгоритмы и фильтры поиска Google
    • Authorship Shake-up. 2013.12.19. Сокращение количества расширенных сниппетов для страниц содержащих авторскую разметку, в связи с злоупотреблением и попыткой повышать свой Author Rank.
    • Несоответствие изображения (Image Mismatch). 2013.11. Возможны ручные санкции за то, что изображение на сайте не соответствует содержанию, который индексируется и отображается в результатах поиска. Думаю это связано с тем, когда то или иное изображение подписывается в alt теге текстом никак не связанным с самим изображением.
    • Колибри (Hummingbird). 2013.09.27. Если кратко этот поисковый алгоритм отвечает за "очеловечивание поиска", "разговорный поиск". Благодаря этому алгоритму Google распознает смыслы в сложных запросах, а не просто реагирует на ключевые слова, учитывает все контексты и образы, скрытые смыслы поискового запроса, вплоть до вашего местоположения, конструкции фразы и выдает наиболее релевантные результаты.
    • In-depth Articles. 2013.08.06. Google добавляет в поисковую выдачу несколько статьей "из глубинки" которые более широко, глубоко и полно раскрывают тематику запроса - "высококачественный контент". Ссылки на эти статьи будут отображаться в блоке "In-depth articles", который будет располагаться в самом низу первой страницы поисковой выдачи. Чтобы статья считалась "высококачественной" она должна соответствовать уйме критериев: от 2000 слов, иметь подтвержденное авторство, содержать микроразметку Schema.org и тд. и тп.
    • Payday Loan. 2013.06.11. Новый подход\алгоритм для удаления из поисковой выдачи заспамленных результатов по таким "спамных запросам" как "кредитование", "кратскосрочные займы", "порно" и тд.
    • EMD (Exact Match Domain). 2012.09.28. Фильтр который понижает позиции низкокачественных сайтов, заточенных под определенный запрос, который фигурирует в домене сайта. Например если на домене download-free-android-games.com находится низкокачественный сайт, с десятком страниц, оптимизированных под запрос "download free android games", то такой сайт скорее всего попадет под этот фильтр.
    • DMCA Penalty. 2012.08.10. Google будет наказывать сайты за использование контента нарушающего авторские права.
    • Knowledge Graph (Граф знаний). 2012.05. В поисковой выдаче, в правой части экрана, для повышения качества поисковой системы появилась "панель знаний", который по все большему количеству запросов предоставляет краткую информацию (релевантную запросу) собранную из разных источников.
    • Пингвин (Penguin). Введен 2012.04.24. Борьба с поисковым спамом, с упором на внешние факторы, хотя внутренние также учитываются, например внутренняя перелинковка со спамом в анкорах. Алгоритм понижает в результаты выдачи или удаляет из поиска сайты использующие спам-методы для повышения своих позиций. Созданные для манипуляции поисковой выдачи, сайты с неестественной ссылочной массой (много входящих прямых анкоров, спам в комментариях и блогах, ссылки в профилях, подписях на форумах, ссылки с некачественных сайтов, линкопомоек). Анализирует качество, количество и скорость изменения ссылочной массы. Борьба со всякими схемами построения ссылочного профиля.
    • Венеция (venice). Введен 2012.02.27. Учитывается региональность пользователя для естественной выдачи. Google отдает предпочтение сайтам, которые находятся локально ближе к пользователю. Пользователям, находящимся в разных регионах, стали отображаться разные результаты.
    • Page Layout Algorythm. Также известный под именами Top Heavy или Baby Panda. Введен 2012.01.19. Несколько раз обновлялся. Анализ полезности контента сайта на первом экране, который доступен без прокрутки, сайты с обильной рекламой на первом экране ранжируются ниже. Имеется в виду, если Вы открыли какой-то сайт и увидели на экране сплошную рекламу, по скролили вниз и там увидели уже полезный контент - это очень плохо, если увидели 50% полезного контента и 50% рекламы - это уже лучше, а если при открытии страницы всю область экрана заняла только полезная информация и где-то ниже, если скролить, находиться реклама, то это идеально. Уменьшите количество "пустого места" в шапке.
    • Свежесть (Freshness). 2011.11. Должен затронуть 35% запросов, которые чувствительные ко времени, с акцентом на "свежесть" информации.
    • Шифрование запросов (Query Encryption). 2011.10. Поисковые запросы начали шифроваться, SEO-оптимизаторы теперь не могут анализировать по каким запросам посетители переходят из google.
    • Разбивка на страницы (Pagination Elements). 2011.09. Для борьбы с дублирующим контентом введены ссылочные атрибуты rel=prev и rel=next.
    • Google+. 2011.06. Запущена социальная сеть Google+ которая тесно интегрирована с другими продуктами google.
    • Schema.org. 2011.06. Yahoo, Google и Microsoft ввели новые HTML-теги, для структуризации данных.
    • Кнопка +1 (The +1 Button). 2011.03. Появление кнопки +1, нажатие позволяет пользователям влиять на результаты поиска в своем социальном кругу.
    • Панда (Panda). Введен в 2011. Много раз обновлялся в течение нескольких следующих лет. Создан для борьбу с веб-спамом с упором на внутренние факторы.
      • Контент: учитывается качество и уникальность контента. Контент должен быть интересным для посетителей и в полную меру отвечать на их запросы. Контент не должен быть скопирован откуда-либо (высокий процент наличия копипаста на сайте ведет к негативным последствиям), не должно присутствовать дублей, не должно быть страниц-пустышек без контента (например страницы тегов, служебные страницы), не должно быть "шаблонных текстов".
      • Исходящие ссылки: ссылайтесь на тематические ресурсы с хорошей репутацией. Если текст записи посвящен компьютерам, а ссылка ведет на интернет-магазин обуви - это плохо. Не ссылайтесь на некачественные, сомнительные ресурсы. Алгоритм негативно относиться к продажным ссылкам
      • Поведенческие факторы: показатель отказов, время на сайте, какой процент людей возвращается на сайт - эти все факторы учитываются алгоритмом.
      • Очистка от дорвеев, сателитов, сайтов созданных только для размещения рекламы и ссылок
      • Учитываются ошибки в тексте (стилистика, грамматика, орфография)
      • Учитывается соответствие тегов и мета-тегов (title, h1 и пр.) страницы к ее содержимому
      • Учитывается перенасыщение контента ключевыми словами.
      • Трастовым сайтам дается еще больше преимуществ.
    • Социальные сигналы (Social Signals). 2010.12. Google и Bing подтвердили, что используют социальные сигналы в определении рейтинга, в том числе из Twitter и Facebook.
    • Негативные отзывы (Negative Reviews). 2010.12. При ранжировании учитываются негативные отзывы пользователей и компаний.
    • Мгновенный просмотр (Instant Previews). 2010.11. В результатах поиска появилась иконка увеличительного стекла, если ее нажать отображался предварительный просмотр страницы, не переходя на сам сайт. Расценивается как сигнал к тому, что сайт должен выглядеть опрятно, с хорошим дизайном и удобной структурой.
    • Мгновенный Google (Google Instant). 2010.09. Мгновенное отображение результата поиска во время ввода поискового запроса.
    • Апдейт брендов (Brand Update). 2010.08. Один и тот же домен может несколько раз попадаться в поисковой выдаче .
    • Кофеин (Caffeine): 2010.06. Окончательно введен после несколько-месячного тестирования. Алгоритм нацелен на увеличение количества проиндексированных "свежих" страниц, позволяет индексировать новоявленные страницы с большей скоростью, призван уменьшить отрезок времени за который новая (или обновленная) страница попадает в индекс.
    • Первомайское (May Day). 2010.05. Замечено значительное падение трафика с поисковых запросов которые содержат большое количество слов (длинный хвост).
    • Обновление Google Places. 2010.04. Добавлены некоторые функции.
    • Поиск в реальном времени. 2009.12. Окончательно введен поиск в реальном времени: происходит быстрая индексация твитера, новостей и социальных медиа-ресурсов.
    • Предварительный анонс Кофеина (Caffeine). 2009.08. Анонс масштабных изменений инфраструктуры поиска, для ускорения индексации, расширения индекса, индексации и ранжировании в реальном времени. Теперь контент сайта и частота его обновления, внутренняя оптимизация (перелинковка, удобство пользования) имеют еще большее значение. Сайты которые медленно открываются и содержат битые ссылки могут понижаться в выдаче.
    • Rel–canonical Tag. 2009.02. Канонические теги получили поддержку Google, Yahoo и Microsoft.
    • Винс (Vince). 2009.02. Большие бренды получили большое преимущество.
    • Google подсказки (Google Suggest). 2008.08. Появление выпадающих строк с подсказками при вводе поискового запроса.
    • Дьюи (Dewey). 2008.04. Непонятные сильные колебания в позициях
    • Баффи (Buffy). 2007.06. Мелкие изменения.
    • Универсальный поиск (Universal Search). 2007.05. В результаты поиска интегрированы новости, видео, изображения и прочее.
    • Фальшивая тревога (False Alarm). 2006.12. Были зафиксированы значительные изменения в позициях, но google утверждал что ничего не изменял.
    • Обновление соплей (Supplemental Update). 2006.11
    • Bigdaddy: 2005.12. Борьба с страницами которые содержат только ссылки или рекламу, борьба с дублированным контентом, копипастом и засильем партнерских (реферальных ссылок), учитывание редиректов 301/302, канонизация.
    • Jagger. 2005.10. Борьба с ссылочными фермами, покупными, взаимными (между ресурсами разной тематики) и не качественными ссылками.
    • Места и карты (Google Local/Maps). 2005.10. Google призвал компаниям обновлять свою контактную информацию на картах.
    • Гиллиган (Gilligan). 2005.09. Google Toolbar и прочие метрики теперь будут обновляться раз в три месяца. Индекс все также обновляется ежедневно.
    • Персонализированный поиск. 2005.06. Использование истории поисковых запросов с учетом персональных предпочтений.
    • XML Карта сайта. 2005.06. HTML формат карты сайтов заменили на XML и позволил их загружать через панель вебмастеров, что дало возможность влиять на сканирование и индексацию.
    • Бурбон (Bourbon). 2005.05. Возможно обновление связано с дублированным и не каноническим контентом.
    • Аллегра (Allegra). 2005.02. Специфика обновления не совсем ясна. Были догадки что оно повлияло на "песочницу", оптимизировался латентно-семантический анализ, google стал наказывать за подозрительные (возможно покупные) ссылки.
    • Nofollow. 2005.01. Для борьбы с ссылочным спамом запущен параметр nofollow (совместно с Yahoo и Microsoft), который сильно повлиял на "ссылочный граф".
     
    cyber_punker и b7186 нравится это.
  2. Darkness

    Darkness Постоялец

    Регистр.:
    21 янв 2013
    Сообщения:
    146
    Симпатии:
    69
    • Бренди (Brandy). 2004.02.
      • Появился латентно-семантический анализ (тематичность).
        • Гугл стал понимать синонимы.
        • Изменился анализ ключевых слов.
      • Повышено внимание по поводу релевантности анкоров
      • Появилась концепция "ссылочных-соседей"
    • Austin: 2004.01. Продолжение борьбы с невидимым текстом, борьба переспамом ключевых слов и мета-тегов.
    • Флорида: 2003.11. Исключение страниц с повторяющимся анкором и переспамленных ключевыми словами, страницы с не уникальным контентом и сайты с купленными входящими ссылками. Многие сайты потеряли свои позиции, владельцы бизнес-сайтов были в ярости. Старые SEO-тактики умерли, и "игра" стала интересней.
    • Сопли (Supplemental Index). 2003.09. Google стал индексировать больше документов, но чтоб это не повлияло на производительность, был введен дополнительный индекс, который обновлялся значительно реже.
    • Фриц (Fritz). 2003.07. Теперь выдача обновляется ежедневно ("постоянно"), а не ежемесячно в больших партиях.
    • Эсмеральда (Esmerelda). 2003.06. Конец политики регулярных ежемесячных обновлений.
    • Доминик (Dominic). 2003.05. Замечено появление ботов "Freshbot" и "Deepcrawler". Изменено влияние обратных ссылок.
    • Кассандра (Cassandra). 2003.04. Скрытые тексты и ссылки наносят вред, также вредят большое количество ссылок с доменов принадлежащих одному лицу.
    • Бостон (Boston). 2003.02. Первый ап с официальным названием. Анонсировали политику ежемесячных обновлений, которая впрочем не прижилась.
    • Хилтоп (Hilltop). 2001 год. Появилось разделение выдачи для коммерческих и не коммерческих запросов.
    • Google тулбар. 2000.12. Google запустил Toolbar PageRank - с его помощью теперь можно посмотреть какой PR у той или иной страницы, благодаря чему зарождается SEO.
    • PageRank. 1998.03. Передача ссылочного веса - чем больше ресурсов ссылаются на страницу, тем выше ее PR и позиции и тем больше веса она передает страницам на которые ссылается.

    Алгоритмы и фильтры Яндекс:
    Интересный факт: имена алгоритмов начинаются с буквы на которую заканчивается предыдущий алгоритм (фильтр АГС не в счет)
    • Обнуление ТИЦ. 2014.04.15. В фильтр АГС введены изменения, вместо исключения из поиска Яндекс обнуляет ТИЦ сайтам содержащих малополезный контент для посетителей. Ссылки с таких сайтов не учитываются, а сам сайт ранжируется ниже.
    • Изменения в ранжировании страниц с шокирующей рекламой. 2014.03.20. Страницы содержащие "шокирующую" и неприятную рекламу понижаются в ранжировании. К такой рекламе относятся, например, тизеры с фотографиями болезней, изображение частей тела людей с сильно избыточным весом, реклама, в которой используются картинки с явно выраженным эротическим содержанием, кадры из фильмов ужасов и тому подобное.
    • Отмена учета ссылок в ранжировании коммерческих запросов. 2014.03.12. Отмена вводится поэтапно, начиная с Московского региона и наиболее распространенных тематик для коммерческих запросов и заканчивая распространением на остальные тематики и регионы.
    • Дублин. 2013.05.30
      • Обновление персонального поиска: учет сиюминутных интересов (помимо долговременных и кратковременных)
    • Калининград. 2012.12.12
      • Персонализация поиска: подсказки и ответы исходя из личных предпочтений, интересов исходя из предыдущих запросов и статистики. Интересы могут быть кратковременные и долговременные.
      • Учет "любимых" и ранее посещаемых сайтов.
      • ТИЦ теряет актуальность
    • Popup-фильтр. 2012.05. В Интернете набрали популярность popup-окон, которые имитируют всплывающие информационные окна социальных сетей (новое сообщение вконтакте, заявка на добавление в друзья и т.д.). Яндекс теперь распознает использование таких popup-окон и накладывает санкции.
    • Рейкьявик. 2011.08.17.
      • Учет языковых предпочтений
      • Введено тестирование "оригинальные тексты", с помощью которых владелец контента может сообщить о своем авторстве
    • Краснодар.2010.12.15.
      • "Спектр" – позволяет учитывать потребности пользователей, которые не были явно сформулированы в запросе. Например, по запросу "бетховен" пользователи теперь могут найти и биографию композитора, и его музыку, и фильм "Бетховен")
      • Введены поисковые категории (около 60) : быт, авто, работа, новости и т.д.
      • Учитываются некоторые поведенческие факторы
      • Добавлены расширенные сниппеты для сайтов организаций (можно включить адреса, телефон и т.д.)
      • Началась индексация "Вконтакте" и отображение профилей в результатах поиска
    • Обнинск. 2010.09. 13.
      • Улучшена обработка геонезависимых запросов.
      • Формула ранжирования увеличилась еще больше и достигла 280 Мб.
      • Улучшено определение автора контента
      • Расширен словарь транслитерации, для запросов на транслите
      • В кеше можно узнать дату последней индексации страницы
      • Ограниченно влияние искусственных ссылок на ранжирование
      • улучшено определение автора текста
    • Конаково. 2009.12.22.
      • В "региональной выдаче" добавлено 1250 городов
      • Появились новые операторы для поисковых запросов.
    • АГС 2009-й год, фильтр регулярно обновляется. Фильтр предназначен для борьбы с сателлитами, с сайтами продающие ссылки с бирже, сайтами c большим количеством некачественной и ненужной информации, которая не несет в себе какой-либо пользы для посетителей. Признак фильтра: из индекса "вылетают" все страницы сайта, в индексе остается лишь главная и в редких случаях еще несколько страниц, новые страницы не индексируются. Алгоритм фильтра засекречен, но есть некоторые официально подтвержденные сведения. Наложение АГС — результат совпадения нескольких факторов, которые по отдельности на попадание сайта под фильтр не влияют, вот некоторые из факторов:
      • торговля спам-ссылками на сайте
      • небольшой возраст сайта
      • число входящих ссылок на ресурс мало по отношению к исходящим ссылкам
      • низкое количество уникальных посетителей на сайте
      • неуникальное содержимое.
    • Снежинск. 2009.11.17. Введен новый самообучающийся алгоритм "MatrixNet", который учитывает при ранжировании более тысячи параметров. Были введены новые региональные факторы. Последствия введения алгоритма:
      • более старые ссылки стали ценее
      • плохое отношение к быстрому росту ссылочной массы
      • стал более важен фактор возраста сайта
      • траст сайт состоит из множества факторов
      • уникальный контент стал еще более значительным фактором
      • плохое отношение к длинным текстам, которые насыщенны ключевыми словами
    • Арзамас (Анадырь): 12.10.2009 г. Внедрение географической принадлежности.
      • Понимание не однозначности слов в запросах, понимание русского языка: жаргоны, словоформы.
      • Теперь учитывается регион пользователя
      • Сайту присваивается регион, в зависимости от IP, контента и описания в Яндекс Каталоге
      • Введена классификация геонезависимых и геозависимых запросов
      • Улучшен поиск по картинкам
      • Введен фильтр на агрессивную рекламу (popunder, clickunder (bodyclick))
    • Находка: 2008.11.09.
      • Введен фильтр за редирект на другой сайт (борьба с дорвеями)
      • Стали играть факторы возраста домена и сайта (введено 19 регионов)
    • Магадан: введен 2008.05.16.
      • Стало учитываться вдвое большее количество факторов.
      • Введено распознавание аббревиатур и обработка транслита.
      • Яндекс начал индексировать зарубежные сайты
      • Определение уникальности контента
     
    Последнее редактирование: 8 май 2014
    imtecseo, b7186, matrixid и ещё 1-му нравится это.
  3. Darkness

    Darkness Постоялец

    Регистр.:
    21 янв 2013
    Сообщения:
    146
    Симпатии:
    69
    Сколько нужно ссылок чтоб получить тот или иной PR (google page rank)
    В верхней строке на желтом фоне значение PR ссылающихся на вас страниц, в зеленом столбце слева PR которого вы хотите достичь, в самих клетках указано количество страниц которые должны на вас ссылаться. То есть для того чтоб получить PR5 нужно чтоб на вас ссылалось 101 страница с PR4, либо 19 с PR5, либо 4 с PR6.
    FeJZ8dgrWio[1].jpg
     
    kktak и b7186 нравится это.
Статус темы:
Закрыта.