Парсер Я.Каталога

Статус
В этой теме нельзя размещать новые ответы.

LEXAlForpostl

Мой дом здесь!
Регистрация
21 Май 2008
Сообщения
766
Реакции
228
Здравствуйте.
Помогите пожалуйста, написать парсер Я.Ки.
В какую сторону копать.
Результат хочу сделать - вывод по категориям.
 
В сторону Curl или Snoopy. HttpAnalyzer в помощь
 
Как сайты спарсивать - это понятно.
Но как делать так, тчобы они по категориям, субкатегориям шли, как в Я.Ке?
 
Как сайты спарсивать - это понятно.
Но как делать так, тчобы они по категориям, субкатегориям шли, как в Я.Ке?

Что значит как? Не совсем понятен вопрос.

Но все же. Заходишь на . Парсишь все ссылки в тегах <dt>. Далее рекурсивно проходишь по ним и парсишь опять <dt>, пока их не будет. Вот и получишь список категорий (и ссылки на все подкатегории). Потом запускаешь скрипт парсинга самых глубоких подкатегорий ( ) и парсишь уже ссылки.

Попробуй поставить вопрос точнее.
 
Не получается написать регулярку, которая бы и урл и название категории парсила.
Т.е. урл написал регулярку, а название не получается.
И ещё вопрос, как организовать эту зависимость категория -- субкатегория1 -- субкатегория2 --- ...
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху