подскажите парсер

Тема в разделе "Мелочи", создана пользователем naytilius, 16 янв 2011.

  1. naytilius

    naytilius

    Регистр.:
    18 окт 2008
    Сообщения:
    311
    Симпатии:
    160
    Привет нужен серверний пхп парсер.
    Именно сервений так как декстопний парсер смогу на зено постере навалять за 5 мин, но у меня канал в инет пиец тугой (обичной модем не сильно разженешся.)
    С требований возможность настроить что парсить (тоесть настроить метки между которими брать контент.) и работа через прокси.
    2.настраиваемий формат вивода. (просто чтоб навания статьи в тег н2 заключить) или воопше просто всю текстовку сохранить
    3. Чтоб парсер полностью удалял разметку, ссилки (если они анткорние то анкор чтоб оставлял.) все включения ява. Воопшем на виходе голий текст.
    НУжен именно серверний скрипт так как есть контент довнлоадс. но из за скорости инети у меня не оч сильно разгонится в парсинге могу.
    Скрипт ну3жен под парсинг нескольких буржуйских каталогов статей. тоесть на вход я задаю линки на статьи а на виходе статьи в одном файле с нужним мне форматом.
    так 3-4 каталога.
    Да и интересно сколько будет стоит заказ подобного скрипта в фрилансеров. тоесть парсеров под нужние директории.
    нада промишленно парсить
    1.ezinearticles.com
    2.www.articlesbase.com
    и парочка топових каталогов
     
  2. Maza

    Maza

    Регистр.:
    3 июл 2007
    Сообщения:
    255
    Симпатии:
    116
  3. gts

    gts

    Регистр.:
    12 сен 2010
    Сообщения:
    271
    Симпатии:
    42
  4. naytilius

    naytilius

    Регистр.:
    18 окт 2008
    Сообщения:
    311
    Симпатии:
    160
    так текс маркет вроде не поддерживает возможность задавать конткретой список с которого парсит + настройка парсера... хотя попробуй та к как с текс маркетом не работал а работал токо с веб грабером.
     
  5. Gomep

    Gomep Постоялец

    Регистр.:
    12 сен 2009
    Сообщения:
    85
    Симпатии:
    5
    может унипарсер + ексель?
     
  6. naytilius

    naytilius

    Регистр.:
    18 окт 2008
    Сообщения:
    311
    Симпатии:
    160
    серверное решения надо, у меня очень галимий интернет просче говоря обичной модем плюч глючить есче.
     
  7. ihrik

    ihrik

    Регистр.:
    24 янв 2009
    Сообщения:
    311
    Симпатии:
    91
  8. Djutan

    Djutan Создатель

    Регистр.:
    29 янв 2011
    Сообщения:
    21
    Симпатии:
    8
    Есть неплохой онлайн парсер от yahoo
    http://pipes.yahoo.com/pipes/
    Немного замороченная регистрация. После нее жмете Create Pipe и в режиме Drag&drop устанавливаете модули и редактируете алгоритм парсинга.
     
  9. naytilius

    naytilius

    Регистр.:
    18 окт 2008
    Сообщения:
    311
    Симпатии:
    160
    simple_html_dom.php как по мне единий нормальний виход.
     
  10. pochenok

    pochenok

    Регистр.:
    27 ноя 2008
    Сообщения:
    175
    Симпатии:
    59
    можно как было сказано выше сделать рсс ленту из чего угодно черех яху пайпс, а потом ленту парсить например rssrepublisher