[Ищу] Нужен парсер

Тема в разделе "SEO Скрипты", создана пользователем pehota, 27 окт 2009.

Статус темы:
Закрыта.
  1. pehota

    pehota

    Регистр.:
    2 апр 2007
    Сообщения:
    359
    Симпатии:
    204
    Нужен парсер под следующую задачу. Не знаю существует ли что-то готовое, но может хотя бы пнёте в нужную сторону. Надо пройтись по списку URL и выдрать с абсолютно одинаковых страниц некий кусок текста и сохранить результат в текстовик.

    На моей памяти, еще до популяризации rss, существовала программка под названием watznew, в которой задавался шаблон и она парсила информацию от тэга до тэга. Может есть что-то подобное?
     
  2. ravist

    ravist

    Регистр.:
    24 июл 2007
    Сообщения:
    202
    Симпатии:
    97
    Сам искал такой парсер. Не нашел. Покупал универсальные дорогие вскладчину, но они тоже не справились с моей задачей. У меня была примерная схема:
    1. Парсить от "</b>:" до "<br></td></tr>" и складывать в 1-й столбец таблицы.
    2. Парсить от "height=50> - <b>" до "</b>:" и складывать во 2-й столбец таблицы.

    Пришлось попросить знакомого программиста - он мне написал такую парсилку под конкретный сайт.

    Теперь вот он пишет в свободное время универсальную парсилку с нормальным интерфейсом, надеюсь его парсилка пригодится людям и труды окупятся.
     
  3. pehota

    pehota

    Регистр.:
    2 апр 2007
    Сообщения:
    359
    Симпатии:
    204
    Multireader что-то подобное вроде как может, у него даже цена сейчас более чем гуманная, но вот скормить список ссылок в демке не удалось, посему пришлось искать другие решения. К сожалению.
     
Статус темы:
Закрыта.