как парсить форумы на определённом движке

Статус
В этой теме нельзя размещать новые ответы.
Ну если не зацикливаться на хрефере и хрумере, то способов оч. много. после парсинга поисковика, например можно попарсить сам сайт, на предмет возможности вставки урл, комммента, регистрации, проверки тиц, пр, итд... по большому счету разница от оэтого только положительная! Толи дело за пару дней собрать базу 1к с пробиваемостью процентов 80%, довольно чистую, и качественно ее проспамить или собрать 50к и проспамить за то время, и получить примерно такой же а скорее всего даже хучший результат и по пробиваемости и по качеству, и по абузам если речь идет о дорах.

Кстати на счет парсинга например в рунете выхлоп получается больше от парсинга яндекса по кею типа - отличный пост, добавил в закладки чем например хреф+хрум =( правдо в первом случае курл в зубы и неделю ананизма
 
Кстати, интересная идея парсинга - сделать скрипт, который будет шерстить страницы форумов с member на наличие ссылок в поле домашней страницы пользователей. Там будет 90% спамленных сайтов, потом по этим сайтам парсить в том же Хрефере пробиваемые ресурсы.
 
Тоже заинтересовался, что же это за КРАУЛЕР.
Единственный вменяемый сервис что смог отыскать
Может Pftriot его имел ввиду?

PS Сам пользуюсь для парсинга AGGRESS Parser-ом.
 
...Там будет 90% спамленных сайтов, потом по этим сайтам парсить в том же Хрефере пробиваемые ресурсы.
Из этих 90% спамленых 50% дохлые или фейк остальные или "Вася Пупкин Андерконстракшн" или "нофоллов, ноиндекс."... И лишь кропаль будет годен для проспама.
 
ну так для того что бы не парсить форумы с ноиндекс, на то парсер и есть, можно же их фильтровать
 
Кхм, имеется предчувствие что тему снесут, но всетаки отвечу.:D
возьми форум на нужном тебе движке(штуки 3) найди как можно больше признаков этого движка(признак-это отличие от других движков)
вбивай в парсер признаки что нашел и парсь сколько душе угодно.
Незабывай комбинировать запросы чтобы выжать максимум.

Помоему адекватное, а самое главное бесплатное решение:smmne:
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху