Парсер Директа с обходом капчи

Статус
В этой теме нельзя размещать новые ответы.

dig555

Постоялец
Регистрация
22 Июн 2007
Сообщения
365
Реакции
160
Мне очень давно хотелось заиметь парсер, который обходит капчу в Яндекс.Директе, пока не дорос до творений Пастухова. И я его заимел. Этот парсер был написан под заказ, человеком с этого форума - Для просмотра ссылки Войди или Зарегистрируйся'ом. Пользуясь случаем, спешу прорекламировать его как отличного кодера и оперативного исполнителя.

А поскольку сегодня у меня хороший день:yahoo: - решил выложить его для общественности.

Итак, вот что он умеет:
-умеет брать сразу несколько кейвордов для парсинга;
-умеет обходить капчу рандомным sleep() или через прокси;
-умеет очищать напарсенное по списку стоп-слов. Указываем в текстовом файле список нежелательных слов (порно, скачать и т.д.), и все кеи содержащие эти слова пускаются под нож.
-встроенная кеемешалка;
-разбивка напарсенного на указанное количество страниц;
-сохранение в указанной папке в файлах, название которых представляет собой транслитерацию кея по которому происходил парсинг + номер части на которые напарсенное было разбито. Т.е. название файлов с кеями идеально подходит в качестве названия поддоменов для доров.

Тестировался автором на локалхосте (win xp, apache, php5) и на сервере freebsd, nginx,php5 Тестировался мной на лохалхосте на Vertrigo.

Обязательно прочитайте ридмишку из архива. По технических вопросам к Для просмотра ссылки Войди или Зарегистрируйся. Если, конечно, он пожелает на них ответить.

Надеюсь, что кому-то будет полезным (хайды на усмотрение модера:(


Зеркало:


И для уважаемых:) :
[RESPECT="10"]http://beststars.ru/xparser_for_nulled.zip[/RESPECT]
Пароль стандартный - Для просмотра ссылки Войди или Зарегистрируйся
Прошу поддержать мой первый релиз дружным нажатием кнопки "Спасибо";)
 
Странно, воде и работает, но как правило парсит пару сотен кеев, а потом строка
the page
и так в каждом, запросы точно большого количества - секс например, а парсит только чуть-чуть. Это мне с хостом не повезло? Парсинг через прокси 500 шт все живые, не забаненые яндексом.
 
Странно, воде и работает, но как правило парсит пару сотен кеев, а потом строка
the page
и так в каждом, запросы точно большого количества - секс например, а парсит только чуть-чуть. Это мне с хостом не повезло? Парсинг через прокси 500 шт все живые, не забаненые яндексом.

У меня нормально парсит. Добавил кей, поставил ограничение 10000, так все 10000 и вытащил. Правда парсил не через прокси, а ставил sleep. Проблема в другом, не отображается индикатор хода процесса. После запуска перекидывает опять на первую страницу, хотя на Денвере все нормально. Тоже проблема наверно в хосте..
 
Перезалейте скрипт плиз, ссылки мертвы

abctop - Ошибка 500 при скачивании
beststars - отдает только половину файла :)
 
выложите плиз хоть с ограничением на 20 сообщений.
 
  • Заблокирован
  • #7
Мне очень давно хотелось заиметь парсер, который обходит капчу в Яндекс.Директе;)

Я конечно тебя поблогодорил но я за всю свою жизнь капчу в Яндекс директе и не видел.
 
Видишь суслика? Не видишь? А он есть :) Капча появляется только тогда, когда директ начинает считать тебя ботом. Т.е. при большом количестве запросов за единицу времени.
На вот простой парсер. После того, как отработаешь 5-10 запросов - он работать откажется. Зайди тогда в директ и увидишь искомую капчу.:)
 

Вложения

  • wordstat.rar
    938 байт · Просмотры: 20
Я конечно тебя поблогодорил но я за всю свою жизнь капчу в Яндекс директе и не видел.
или если хочешь увидеть капчу существует еще такой вариант: зайди в ЯндексДирект и набери любое слово(например СТРОЙКА или КИРПИЧ) и переходи быстро на следующие страницы (2-я 3-я и т.д.) и появится капча.

dig555 - а этот парсер что работает только с кеями из одного слова и обязательно надо задать сколько страниц он парсил? нельзя парсить до конца?
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху