какой xml парсер выбрать?

Тема в разделе "PHP Pro", создана пользователем Any_Key, 20 окт 2009.

Статус темы:
Закрыта.
  1. Any_Key

    Any_Key aka mad red cat

    Регистр.:
    30 мар 2006
    Сообщения:
    388
    Симпатии:
    344
    Необходимо обрабатывать очень много xml файликов (создавать/разберать) размером не более 1 мегабайта, отсюда вопрос какой из имеющихся в налиции парсеров для пхп быстрее???
    из вариантов что на ум пришло
    Simple Xml
    Dom xml
    XSL (не совсем по теме но базовыйфункционал он имеет)
    Сам работал только с Simple XML но когда вопрос встал в 100 файлов в минуту засомневался в его порядочности
     
  2. swer

    swer

    Регистр.:
    15 июн 2008
    Сообщения:
    305
    Симпатии:
    38
    В XSL нужно долго копатся в мануалах хотя штука мошная,но я не вадержал:)
    Dom хорош,если xml без ошибок иначе нет.
    А симпл у него и имя говорит само за себя, думаю если правильно выбрать тактику и настройки то отлично справится.ИМХО
     
  3. Any_Key

    Any_Key aka mad red cat

    Регистр.:
    30 мар 2006
    Сообщения:
    388
    Симпатии:
    344
    Вы меня немного не поняли вопрос стоит в скорости работы
    и не важно сколько и как с ним копатся...
    хотелось бы увидеть конкретные примеры обработки данных
    кто за сколько справился...
     
  4. swer

    swer

    Регистр.:
    15 июн 2008
    Сообщения:
    305
    Симпатии:
    38
    Я вас отлично понял, тем более что сам такой фигней страдаю,сам использую самописную.
    Такую статистику вам вряд ли приведут.
    Из приведенных опробовал последние две,дом немного тормознут,симпл хорош, а вот о хсл много положительных отзывов но для меня оказался трудноват,а мож прост лен было вникать...в общем хсл думаю подойдет,но все же большинство факторов зависеть от железа и прямых рук.
     
  5. everest

    everest

    Регистр.:
    20 дек 2006
    Сообщения:
    197
    Симпатии:
    20
    Я использую SAX парсер.
    Скорость нравится не особо.
     
  6. _axl

    _axl Постоялец

    Регистр.:
    24 сен 2008
    Сообщения:
    50
    Симпатии:
    8
    SAX хорош при обработке больших файлов, т.к. работает поточно
    и он реально медленный
     
  7. Alternator

    Alternator

    Регистр.:
    23 мар 2009
    Сообщения:
    295
    Симпатии:
    145
    Ложь и провокация
    да, при невалидном XML/HTML он выбрасывает кучу warning-ов, что тем не менее не мешает ему построить в памяти DOM-дерево, и работать с ним дальше
    сам регулярно его использую для парсинга HTML-а самых различных ресурсов(и по-моему ни одного полностью валидного не было)
    борюсь с warning-ами при помощи собаки
    скорость работы приемлимая.
    однажды даже сравнивал с регулярками(стоял холивар), и был вполне удовлетворен его результатами, так как в худшем из тестов он ненамного отставал от регулярок(тестировались простые выборки данных, но из объемных файлов)

    ТС-у же рекомендую написать модуль для тестирования скорости каждого из предполагаемых способов, и просто сравнить
    для выборки голого title-а из мегабайтного файла предположительно simple будет быстрее чем DOM
    если нужна помощь, то помогу написать кусок кода для DOM, хотя там все достаточно просто, ИМХО
     
  8. verissimo

    verissimo

    Регистр.:
    26 сен 2006
    Сообщения:
    438
    Симпатии:
    139
    У кого-нибуд есть парсер PRAX?

    Раньше находился тут http://www.oreillynet.com/~rael/lang/php/PRAX/
     
Статус темы:
Закрыта.