как защитить сайт от парсинга?

Статус
В этой теме нельзя размещать новые ответы.
Самый лучший метод - это всё в Java script запихать и ещё перекодировать, часть кусков, чтоб отображалось и выводилось только для пользователя. Правдо есть свои минусы у кого JS отключен не будет видеть стр.
 
Самый лучший метод - это всё в Java script запихать и ещё перекодировать, часть кусков, чтоб отображалось и выводилось только для пользователя. Правдо есть свои минусы у кого JS отключен не будет видеть стр.
А много ли юзеров сидит в инете с выключенным JS? :eek: Я так думаю, что ноль целых и хрен десятых.. ща даже в браузерах мобильников JS выполняется.

Но этот метод всеравно не фонтан, потому как усложнив жизнь парсерам, вы одновременно усложняете ее SEспайдерам, а равно и себе.

Я сам неоднократно писал различные парсеры - парсится всё, что-то проще, что-то сложнее. Потому, на мой взгляд, лучше уделить внимание бэклинкам и индексации, а не воевать с ветряными мельницами.
 
Прятать контент за скрипт это не то что "не фонтан" (Одесса-мама? ;) ) - это безумие, с точки зрения поисковиков....
Я отбросил даже вариант клоакинга, где паукам (проверка по айпи) дают нормальный контент, а пользователю аяксовую муть....
Слишком рискованно.

Что касается того что мол все парсится....
Ну да, даже алекса.ком парсили, несмотря на их пятиэтажные вложенные конструкции, динамически меняющиеся....
Хотя реально проще было получить легальное АПИ :)
 
Упоминание легко редактируется.
Ставьте скрытый текст со ссылками на ваш сайт.
Подробнее например тут:
*** скрытое содержание ***
в том-то и дело, что при автоматическом парсинге, активные ссылки вырезаются самим парсером (или закрываются nofollow, не суть важно), а простое упоминание вида "site.ru" останется, а в некоторых браузерах даже будет подсвечена как активная ссылка. что может позволить получить трафик обратно к себе на сайт.
 
в том-то и дело, что при автоматическом парсинге, активные ссылки вырезаются самим парсером (или закрываются nofollow, не суть важно), а простое упоминание вида "site.ru" останется, а в некоторых браузерах даже будет подсвечена как активная ссылка. что может позволить получить трафик обратно к себе на сайт.
грамотные парсеры простые упоминания сайтов с которых они украли контент заменяют на упоминание сайта на который этот контент добавляется.
 
в том-то и дело, что при автоматическом парсинге, активные ссылки вырезаются самим парсером (или закрываются nofollow, не суть важно), а простое упоминание вида "site.ru" останется, а в некоторых браузерах даже будет подсвечена как активная ссылка. что может позволить получить трафик обратно к себе на сайт.
Трафик за счет упоминания сайта с зачастую откровенных непосещаемых сайтов сделанных под ссылко торговлю - сомнительно.
По указанной мною ссылке текст прячется на уровне CSS
"Чтобы сделать текст невидимым, его надо сделать очень маленьким и скрытым. Это делается следующей конструкцией CSS:
span.invitext { font-size: 1px; letter-spacing: -1px; visibility: hidden;}"

Можно и обычные упоминания делать , но я встречал довольно много копипаста со скрытыми ссылками. Без подсветки внешних ссылок их не видно. А ссылочное передается.
Добавлю мнение - от ручной переработки чужого текста защиты быть не может - вопрос только в целесообразности.
 
100% защиты нет.
С JS шифрование и дешифрированием 100% защиты не получите есть ряд программ которые непосредственно копируют информацию уже с браузера (Kleptomania).
Прог по обработке ( фильтров)текста тоже предостаточно.

Как вариант решения - водяные знаки.
Просьба размещать только с ссылкой на источник.
В теле текста авторские координаторы (часть адреса сайта, название страниц, эл почту своих друзей и т.д) и уникальные ошибки в словах для быстрого поиска плагиата.

Размещать только часть текста остальное в архив с капчей.

Быстрая индексация поисковиков.
 
Rss у меня только на краткую новость.
А трянсляторы rss к сайту не прикручены? Фидбернер, к примеру?

Вы бы первым делом написали хостеру воришки и объяснили всю ситуацию. Маловероятно, но кто знает, может вам помогут.

вот здесь блогер рассказывает,как боролся с парсингом
Бесполезный баян, так ни от одного парсера не спасешься. Даже если вы тоннами будете вливать в них говноконтент, то не факт, что ПС на это как-то отреагирую, живучие эти ГСы блин. В общем только себе навредите))

Как вариант - встройте пингаторы в форму добавления новостей. Почему вордпресовские новости зачастую так быстро индексируются? Пинг. По крайней мере раньше отлично прокатывало)

вот поменяла названия блоков (div)

Вообще очень странно, что это не помогло. Можете сбросить адрес сайта в личку?
 
Трафик за счет упоминания сайта с зачастую откровенных непосещаемых сайтов сделанных под ссылко торговлю - сомнительно.
По указанной мною ссылке текст прячется на уровне CSS
"Чтобы сделать текст невидимым, его надо сделать очень маленьким и скрытым. Это делается следующей конструкцией CSS:
span.invitext { font-size: 1px; letter-spacing: -1px; visibility: hidden;}"
*** скрытое содержание ***
Можно и обычные упоминания делать , но я встречал довольно много копипаста со скрытыми ссылками. Без подсветки внешних ссылок их не видно. А ссылочное передается.
Добавлю мнение - от ручной переработки чужого текста защиты быть не может - вопрос только в целесообразности.
по указанной ссылке в текст зашивается обычное упоминание с какого сайта был потянут текст. да и чистится такое элементарно.
 
  • Заблокирован
  • #20
Сколько я не боролся с воровством, так не смог решить этот вопрос. Судя по всему - кто захочем парсить, ему это легко доступно (в арсерах лишь переменные меняют и все). А толку подавать в суд (если есть копирайты) тоже ноль, в приличную сумму выльется этот суд, и не факт что через неделю ваш сайт будут парсить не один а уже несколько человек
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху