В чём лучше написать парсер?

Тема в разделе "ASM, С/С++, Delphi, Java", создана пользователем RAPCorp, 8 апр 2017.

  1. shadowgm

    shadowgm Писатель

    Регистр.:
    28 мар 2014
    Сообщения:
    4
    Симпатии:
    0
    Смотря что парсить, а так конечно обеими руками за Python 3.x + SublimeText как среда разработки
     
  2. VladimirPutin

    VladimirPutin Создатель

    Регистр.:
    20 мар 2017
    Сообщения:
    19
    Симпатии:
    2
    Python создан практически для этого
     
  3. RORC

    RORC

    Регистр.:
    14 июн 2013
    Сообщения:
    286
    Симпатии:
    93
    Схема выбора, чем парсить

    а) Готовый инструмент -> если есть готовое, проще спарсить и доразобрать на месте.
    б) Сайт без защиты, парсинг без особых требований -> что знаем, тем и пользуемся, лучше с готовыми библиотеками.
    в) Сайт с защитой от парсера -> Берем языки программирования где есть возможность управления браузером.

    От выбора языка мало что зависит, разве что поддерживаемая версия браузера или библиотеки, для всех популярных языков решения есть.

    На текущий момент, практически стандарт - это браузер chrome и его варианты запуска, cef, headless, selenium.
     
  4. strannik_nuendo

    strannik_nuendo Создатель

    Регистр.:
    21 мар 2016
    Сообщения:
    14
    Симпатии:
    2
    Из моего опыта: есть еще такая технология как XSLT. Не используйте ее!
    Приходилось использовать XSLT на работе, и ради интереса написал пару парсеров на нем. Простые парсеры на xslt пишутся молниеносно, но чуть шаг влево - шаг вправо, начинается вынос мозга. Создание и отладка парсера занимает в разы больше времени чем PHP с библиотеками. А после изучения Питона вопрос оптимального языка для парсеров отпал сам собой из-за очевидности.
    Добавлю только, что если знаете PHP, изучать Питон только ради парсера нет смысла.
    Simple HTML DOM Parser для PHP очень прост, изучается за 10-15 минут и в большинстве случаев его достаточно.
     
    Последнее редактирование: 9 авг 2018
  5. Daniella

    Daniella Не подарок, сюрпрайз)

    Moderator
    Регистр.:
    1 июн 2009
    Сообщения:
    313
    Симпатии:
    289
    Уважаемые! Все уже поняли по поводу Python
    есть что сказать- пожалуйста, прекращайте просто повторяться
     
  6. l0cky

    l0cky Постоялец

    Регистр.:
    3 май 2006
    Сообщения:
    84
    Симпатии:
    27
    То, что я видел под PHP, довольно медленно работает, но оправданно для специфических задач.
    Для парсинга с локалки шустро работают решения на Delphy c использованием регулярок или JS опять же с регулярками.