Подскажите малость с парсером

Тема в разделе "PHP", создана пользователем kop, 16 апр 2010.

Статус темы:
Закрыта.
Модераторы: latteo
  1. kop

    kop Постоялец

    Регистр.:
    8 янв 2008
    Сообщения:
    133
    Симпатии:
    27
    Есть сайт объявлений aviso.ua. Сайт очень глупый с просто идиотской структурой. И самое ужасное, что мне нужно спарсить всю его структуру объявлений. С основами парсинга я знаком и в регулярках тоже разбираюсь, но никак не могу сообразить, по какому алгоритму лучше всего его прогнать. Буду очень признателен, если кто-нибудь укажет нужное направление.
     
  2. t0wer

    t0wer BlackHerald

    Регистр.:
    24 июн 2008
    Сообщения:
    733
    Симпатии:
    423
    Я не знаю зачем вам парсить сайт, в котором даже не отлажен движок!
    Попытался открыть объявления и кроме этого:
    ничего нормального не увидел!
     
  3. dellun

    dellun Постоялец

    Регистр.:
    8 дек 2008
    Сообщения:
    101
    Симпатии:
    31
    тебе сюда
    http://parsing-and-i.blogspot.com/
     
  4. ZLioxygon

    ZLioxygon Писатель

    Регистр.:
    13 фев 2008
    Сообщения:
    4
    Симпатии:
    0
    алгоритм простой..
    сначала выпарсить все ссылочки..
    начни с Перейти по ссылке..
    на страницы объявлений..
    типа Перейти по ссылке...
    на них парсить страницы и сами объявления..
    и лучше сразу в бд закидывать..
    в одну таблицу - структуру рубрик..
    а во вторую объявы с указателяит на рубрику..
     
Статус темы:
Закрыта.