Чем лучше всего извлечь email-адреса...

Тема в разделе "Мегафлуд", создана пользователем typus, 26 фев 2015.

  1. typus

    typus

    Регистр.:
    25 июл 2007
    Сообщения:
    630
    Симпатии:
    152
    Приветствую, подскажите, чем лучше всего извлекать мыла с сайтов?
    Скажем, есть сайт, что то типа доски объявлений, там десятки страниц, на каждой странице пару десятков объявлений, при просмотре конкретного объявления открывается мыло автора.
    Но если только начинаешь рекурсивно пробегать по всем ссылкам сайта, с помощью какого-нить емайл экстрактора из сети, то получаешь отлуп в виде каптчи. Каптча несложная, но есть ли экстракторы с распознаванием, не в курсе.
    Или может, подскажете какой-нить другой способ.
     
  2. C-5527

    C-5527 Писатель

    Регистр.:
    24 фев 2013
    Сообщения:
    1
    Симпатии:
    0
    Не уверен, но возможно подойдет A-Parser, но он платный (((
     
  3. svfolder

    svfolder Постоялец

    Регистр.:
    31 июл 2013
    Сообщения:
    95
    Симпатии:
    39
    Способ прост, заказать парсер под конкретную задачу.
    Например у меня )
    Универсальное решение стоило бы бешеных бабок, не думаю что вам надо прям совсем универсальное.
    Я сейчас работаю над парсером, потенциал 80 млн мыл....
     
  4. SUVEREN

    SUVEREN

    Регистр.:
    13 фев 2008
    Сообщения:
    360
    Симпатии:
    175
    Друзья, всем привет.
    Подскажите, есть ли более менее универсальные парсеры ?
    Ну или просто нормальные рабочие парсеры, ничего стоящего на форуме пока найти не получается, все ссылки битые.
     
  5. penguen

    penguen

    Регистр.:
    7 янв 2007
    Сообщения:
    820
    Симпатии:
    93
    epochta extractor но там нету капчи распознователя
     
    SUVEREN нравится это.
  6. Anton

    Anton ¯\_(ツ)_/¯

    Moderator
    Регистр.:
    28 авг 2007
    Сообщения:
    646
    Симпатии:
    637
    A-parser - пипец универсален=)
     
    KPACHODAP и SUVEREN нравится это.