• DONATE to NULLED!
    Форуму и его команде можно помочь, мотивировать модераторов разделов.
    Помогите модератору этого раздела killoff лично.

Помощь Защита от граббера ДЛЕ 8,0

Статус
В этой теме нельзя размещать новые ответы.
KveSteR, а если будет такой сайт ,который можно чиатать, но проблематично скопировать инфу? Причем поисковики нормально будут индексировать весь контент.
Грабберы не подберуться + копипастеры пойдут лесом. Ну а от гуру никто никогда не сможет защититься.
 
Мои пять копеек - ради эксперимента был написан скрипт, который парсит версии для печати. За две минуты можно было вытащить около тысячи новостей (в версии для печати находится полный текст новости). Для получения полной новости этот источник - самый быстый и экономный в плане траффика.
Так-то.
 
  • Заблокирован
  • #14
KveSteR, а если будет такой сайт ,который можно чиатать, но проблематично скопировать инфу? Причем поисковики нормально будут индексировать весь контент.
Грабберы не подберуться + копипастеры пойдут лесом. Ну а от гуру никто никогда не сможет защититься.
Под любую задачу можно написать скрипт. Пример тому:
недавно обратился человек.Нужно было переписать граббер под конкретный сайт.в средине новости выводилась реклама,и на сайте был установлен модуль глоссарий. Вопрос решился за 20 $ в течении полу часа.Если на сайте действительно уникальный интересный контент,то...сами понимаете:)
 
1) отключит RSS - не выход, будут грабить и парсить с сайта
2) убрать версию для печати - не совсем правильно, поставить защиту рефералом - его можно подменить; тут как вариант версию для печати сделать только для зарегистрированных пользователей после ввода кода с капчи - опять же модификация движка, никто бесплатно не сделает;
3) защита картинок сайта антиличем, из минусов - нагрузка на сам сервер, да и реферал опять же подменяется ...
4) Водные знаки с рандомным наложением по углам - как вариант - но это не красиво ...
5) Вставка в новость ссылок, невидимых блоков с сылками на источник - можно обрезать парсером оные ...
6) вставка комментариев в новость в HTML - опять же урезается парсером ...
7) садомазо-вывод новостей через всякие гибриды JavaScript - тоже не вариант, опять же парсинг решает всё ...
8) можно рандомно вставлять div-блоки, которые при наличии CSS-оформления не отображаются, а при граббинге вставляют всякую чепуху в сайт - опять же из рода садо-мазо и парсером режется

Из всего вывод - можно защитится если грабять несколько сайто сразу, а если грабери поставили цель грабить именно вас - они это сделают, разве что у вас обычный варез - они могут и не заморачиватся с модификацией, а вот если качественный контент - могут и денег не пожалеть, так что ... граббер - не робот, ему не напишешь <noindex>/rel=nofollow ...
 
можна напистаь скрипт который будет менять <div id='news-id- на какое-нибудь рандомное значение... тоесть при каждой загрузке станицы оно будет разным и парсинг будет невозможен, также где-нибудь на верху страницы создать:
<div id='news-id-1>Fuck You!</div>

Таким способом можно отсечь всех нубиков, а от ненубиков никуда не дется
 
maksim-ineshin, если ты заметил, я именно про это и говорил. Подмена id - хороший вариант, особенно если сделать генерацию случайных значений там. Но опять-таки, спасает только от стандартно настроенных скриптов.
 
Есть очень хороший способ но это как бы не совсем защита а продвижение можно сказать :-] как говорилось выше некоторые просто ставят грабер на крон и он грабит всё одряд, так вот ставишь свои ссылки в подробной новости сверху и снизу, С сайта Для просмотра ссылки Войди или Зарегистрируйся

Вот такая вот мыслишка:tcl:
 
А как же пользователи которые в закладках оставляют новость по id ! Сохранил одну новость, пришел на нее а потом уже какая-то там порнуха, а как правилоу же и не вспомнишь какаяверсия была файла например !
 
как сказал один мой сотрудник: "если человек может прочитать - машина сможет распарсить" и это тру.
сам неоднократно писал хитрые парсеры...
если задаться целью - все ухищрения коту под хвост... от гуру не уйдешь...
из рекомендаций: версию для печати отдавать только владельцам по крайней мере 1-5 новостей (комменты не в счет - их робот может насрать хорошо);
рсс в любом случае отключить или же подрихтовать ручками как это сделали на THG.ru: "о которой редакция THG подготовила подробный рассказ в конце марта 2009 года, когда игра увидела свет. Подробнее об этом читайте на страницах www.thg.ru..."
они просто сократили вывод информации в рсс до минимума и посылают на свой сайт...
можно разбавить текст каким-нить мусором, который через css скрывать, можно сделать быстро и удобно, а копипастеры пойдут лесом :) да и отсечь это будет сложно, например:
"Это тру текст из поста"
.......^-сюда вставляем что то типа span class="show_always"> кровавая баня /span
ну и так далее... в алгоритм заложить: кажый 5й пробел заменять 1м и 2м словом из распаршиваемого предложения...
в общем прикладываем голову :)
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху