Парсер через Perl

Тема в разделе "Perl, Python, Ruby", создана пользователем Otto, 29 окт 2014.

  1. Otto

    Otto Нарушитель

    Регистр.:
    12 май 2008
    Сообщения:
    481
    Симпатии:
    158
    Очень часто встречаю когда парсеры пишут на Perl. Отсюда у меня несколько вопросов новичка:
    1. Почему на Perl, а не надругом яз. чем-то парсер лучще работает на Perl? Или исходя из того откуда надо парсить?

    2. Требуется ли код Perl компилировать и так выводить на сервер код, или демоны может требуются, или как в PHP, можно изменить и сразу будет заметно изменение...

    3. На каком яз. посоветуете писать (заказать) Парсер? и почему?

    спс.Ув.
     
  2. vitrolov

    vitrolov Постоялец

    Регистр.:
    10 июн 2012
    Сообщения:
    94
    Симпатии:
    77
    Парсеры пишутся на разных языках, и язык програмированния значения не имеет. За несколькими исключениями, если вам ,например, будет что-то нужно только под свои цели.
    Парсеры также пишутся и на Питоне, и на РНР, Делфи и т.д
    Опять же советов вам конкретных никто не даст, каждый из ЯП имеет свои плюсы и минусы, и так ,как поставлен вопрос, какой язык выбрать, тема грозит перейти в глобальный флуд
    Опять же, заказывать смысла нету, проще купить готовый, или попросить в автора добавить небольшой функционал за дополнительную плату.
    Неплохой парсер и причем недорогой Content downloader. Эту програмку все знают ,и думаю его функционала будет достаточно для обеспечения контента
     
  3. Ultharas

    Ultharas Создатель

    Регистр.:
    26 сен 2014
    Сообщения:
    27
    Симпатии:
    10
    Парсеры с готовым функционалом, конечно, хороши. Но они не такие гибкие как написанные вручную. Сам пишу на Python и PHP. Так вышло что начинал с Питона, он меня более чем устраивает. Хочу на многих ЯП проверить и сравнить, но, наверно, все равно вернусь к нему
     
  4. Ewgi

    Ewgi Создатель

    Регистр.:
    26 сен 2014
    Сообщения:
    12
    Симпатии:
    1
    1. Perl входит в состав любого современного дистрибьютива Linux, Основной особенностью языка считаются его богатые возможности для работы с текстом, в том числе работа с регулярными выражениями, встроенная в синтаксис. Перл унаследовал много свойств от языков Си, AWK, скриптовых языков командных оболочек UNIX.
    В общем без разницы на чем писать парсер, все зависит от поставленных задач и имеющихся ресурсов.

    2. Компилировать код на Perl не требуется, язык PHP очень похож на Perl.

    3. Парсер на PHP будет работать у большинства хостеров, а на Питоне парсер ИМХО писать проще, а значить быстрее.
     
    Ultharas нравится это.
  5. ev-goo

    ev-goo Создатель

    Регистр.:
    28 май 2012
    Сообщения:
    10
    Симпатии:
    9
    Что значит проще?
    Проще писать на любом языке который ты хорошо знаешь
     
  6. Ultharas

    Ultharas Создатель

    Регистр.:
    26 сен 2014
    Сообщения:
    27
    Симпатии:
    10
    Проще - значит синтаксис проще. То что на PHP делается в 5 строчек - на Питоне можно красиво и быстро сделать в 1. Не везде такое радикальное соотношение, конечно, но по смыслу так
     
    Ewgi нравится это.
  7. Ewgi

    Ewgi Создатель

    Регистр.:
    26 сен 2014
    Сообщения:
    12
    Симпатии:
    1
    Именно это я и имел ввиду.
     
  8. jho

    jho Создатель

    Регистр.:
    5 фев 2009
    Сообщения:
    13
    Симпатии:
    1
    Если все же решишь использовать python - grab, весьма достойная библиотека для парсинга сайтов
     
  9. gothmog

    gothmog Постоялец

    Регистр.:
    18 июн 2011
    Сообщения:
    60
    Симпатии:
    24
    Лично я пишу парсеры на Perl по следующим причинам:
    1. Есть многопоточность (без извратов с fork и т.д.);
    2. Нормальные библиотеки для работы с HTTP.
    3. Привык.

    Но, если учить с 0 чисто для парсеров и подобного, то лучше все таки брать C# или другой язык, позволяющий удобно работать с СОМ-объектом IE (или Chromium). Потому что многие сайты делают защиту через JS,играться с которой нa Perl не очень удобно.
     
    cocs нравится это.
  10. vionov

    vionov Создатель

    Регистр.:
    2 май 2013
    Сообщения:
    14
    Симпатии:
    1
    Мне товарищ написал на перл. При том сначала парсер, потом то что спарсивается перепарсивается, потом я некоторые параметры вбиваю в ручную. Потом всё это генерируется в описание товаров. ХЗ почему на перл но у меня всё круто работает. PHP кодеров, которых просил с этим не справились