Инструменты определяющие видимость ссылки на странице?

Тема в разделе "Тех. вопросы", создана пользователем Menro, 10 дек 2012.

  1. Menro

    Menro web, seo, email, hack

    Регистр.:
    27 янв 2008
    Сообщения:
    599
    Симпатии:
    112
    Добрый вечер коллеги!

    Очень давно и довольно плотно работаю ссылками, но один вопрос, так и не получается решить. Все дело в том, что при слепой закупки ссылок (по фильтрам) закупается много мусора. Оно понятно, одно дело мусор, который можно вычистить с помощью Вебмастер.Sape, другое дело, когда панелька ничего критичного на странице не видит, а я вижу.

    Так например, вот такой прием:

    height: 1px;
    overflow: hidden;
    width: 1px;
    Див с такими свойствами, не виден на дисплее, а значит и поисковики могут воспринимать подобные ссылки не иначе как покупные или хуже того, проставленные без ведома владельцев (мошенническим или другим подобным способом).
    Собственно вопрос: как обнаружить эти ссылки? Есть ли для этого какие-либо инструменты? Или может я не до оценил возможности Винка?
     
    bob и latteo нравится это.
  2. latteo

    latteo Эффективное использование PHP, MySQL

    Moderator
    Регистр.:
    28 фев 2008
    Сообщения:
    1.402
    Симпатии:
    1.182
    Хороший вопрос!

    Проблема с написанием такого софта в том, что чисто технически есть довольно много способов скрыть линк.
    Помимо 1px дива, можно еще див со ссылкой "накрыть" другим элементом, вынести за границы экрана, подобрать цвет как у фона, стереть через js (хотя это ПС возможно еще не определяют) или даже банально не отображать линк поисковикам плюс еще несколько более экзотических способов...
     
  3. Menro

    Menro web, seo, email, hack

    Регистр.:
    27 янв 2008
    Сообщения:
    599
    Симпатии:
    112
    Думаю, что поисковые системы должны обладать этими механизмами, а значит ими просто необходимо обладать и оптимизаторам.
    В целом все завязано на CSS и JS, я думаю ключ должен быть ближе, что-то вроде визуального определение текста ссылки на дисплее.
    Может быть с помощью ASCII можно это определять?
    В целом, все конечно не страшно, если сайт в продвижении 1 или 2 (в этом случае, можно пробегаться глазами), а если их 5-10 и более, то инструмент был бы очень актуален.

    Если у кого есть идеии, может быть ссылки на подобные темы, буду признателен!

    Минутой позже:

    Есть допустим ABBY, с помощью которого можно распознать текст на печатной странице, при этом довольно плохого качества. С веб-страницам, картинка должна быть более четкая, а соответственно и уровень распознавания выше, что дает возможность определить визуальное присутствие ссылки на странице. Конечно делать скриншоты страниц, и заниматься их распознаванием через существующий софт довольно накладно, но логика я думаю примерно такая.
     
  4. latteo

    latteo Эффективное использование PHP, MySQL

    Moderator
    Регистр.:
    28 фев 2008
    Сообщения:
    1.402
    Симпатии:
    1.182
    О, ABBYY тут даже не обязательно использовать, всё можно реализовать куда более изящно, для случая когда надо проверить небольшой, заранее известный текст... Я думал о цветовом кодировании и поиске по цвету. Но скриншот снимать придётся и в этом большой минус - те инструменты, которые мне попадались делают это довольно неспешно. На проверку одной страницы может уходить около 5 минут и такой инструмент сложно будет использовать на vps, потребуется ПК.
    Как полагаете 5 минут на страницу это допустимые временные затраты?
     
    bob нравится это.
  5. Menro

    Menro web, seo, email, hack

    Регистр.:
    27 янв 2008
    Сообщения:
    599
    Симпатии:
    112
    Безусловно, функция распознавания текста - процесс затяжной, более того потребляет не малые ресурсы.
    Я к сожалению обладаю скромными знаниями в программирование как таковом, по-этому довольно сложно судить о реализации подобного инструмента.
    В любом случае, это можно организовать на Wmail.ru, дать задания искать соответствующие тексты ссылок на страницах и дружина школьников, с удовольствием будет выполнять подобную работу.

    Ну или находить ссылку в исходном тексте, брать <div> или <span> в который она заключена и проверять свойства CSS. Здесь может быть много вариантов, но основные охватить можно. Ну или прогонять все сайты валидаром (ну тогда наверное ссылок и вовсе не купить).
     
  6. bob

    bob

    Регистр.:
    30 авг 2011
    Сообщения:
    155
    Симпатии:
    45
    Проблема очень актуальная!
    примерно 288 ссылок в сутки - не каждая SEO контора столько покупает.
    вполне допустимые временные затраты.
    купить системник за 300$ то же допустимо