Парсер Я.Каталога

Тема в разделе "PHP", создана пользователем LEXAlForpostl, 31 окт 2009.

Статус темы:
Закрыта.
Модераторы: latteo
  1. LEXAlForpostl

    LEXAlForpostl

    Регистр.:
    21 май 2008
    Сообщения:
    739
    Симпатии:
    226
    Здравствуйте.
    Помогите пожалуйста, написать парсер Я.Ки.
    В какую сторону копать.
    Результат хочу сделать - вывод по категориям.
     
  2. potuga

    potuga

    Регистр.:
    22 сен 2009
    Сообщения:
    376
    Симпатии:
    91
    В сторону Curl или Snoopy. HttpAnalyzer в помощь
     
  3. LEXAlForpostl

    LEXAlForpostl

    Регистр.:
    21 май 2008
    Сообщения:
    739
    Симпатии:
    226
    Как сайты спарсивать - это понятно.
    Но как делать так, тчобы они по категориям, субкатегориям шли, как в Я.Ке?
     
  4. potuga

    potuga

    Регистр.:
    22 сен 2009
    Сообщения:
    376
    Симпатии:
    91
    Что значит как? Не совсем понятен вопрос.

    Но все же. Заходишь на http://yaca.yandex.ru/. Парсишь все ссылки в тегах <dt>. Далее рекурсивно проходишь по ним и парсишь опять <dt>, пока их не будет. Вот и получишь список категорий (и ссылки на все подкатегории). Потом запускаешь скрипт парсинга самых глубоких подкатегорий (http://yaca.yandex.ru/yca/cat/Entertainment/Games/Flashgames/Games_for_girls/) и парсишь уже ссылки.

    Попробуй поставить вопрос точнее.
     
  5. LEXAlForpostl

    LEXAlForpostl

    Регистр.:
    21 май 2008
    Сообщения:
    739
    Симпатии:
    226
    Не получается написать регулярку, которая бы и урл и название категории парсила.
    Т.е. урл написал регулярку, а название не получается.
    И ещё вопрос, как организовать эту зависимость категория -- субкатегория1 -- субкатегория2 --- ...
     
Статус темы:
Закрыта.