Помогите распарсить

Тема в разделе "PHP", создана пользователем phillip, 17 мар 2011.

Модераторы: latteo
  1. phillip

    phillip

    Регистр.:
    4 сен 2007
    Сообщения:
    413
    Симпатии:
    15

    Помогите распарсить дубль гис! Самому не получается, а так может кому-то тоже надо. С миру по нитке, носки для улитки.

    Что удалось выяснить:
    Если курлом захожу на Перейти по ссылке , не получаю список рубрик. Надо что-то сделать другое(

    Есть рубрики, и есть подрубрики.

    По адресу
    Перейти по ссылке
    Можно получить все подрубрики, из рубрики 5420

    По адресу
    Перейти по ссылке
    получаем список организаций из подрубрики 717

    По адресу
    Перейти по ссылке
    получаем инфу фирмы

    Номера рубрик и подрубрик для всех городов одинаковые, в принципе можно сразу составить номера подрубрик какие надо допустим
    Мука / Крупы 2232



    там все через ajax подгружается, я его вообще парсить ладом не умею чот :(
     
  2. stealthdebuger

    stealthdebuger Механик

    Administrator
    Регистр.:
    25 авг 2008
    Сообщения:
    634
    Симпатии:
    1.407

    Для получения списка рубрик шлите запрос сюда Перейти по ссылке
    полученное парсим, выбирая названия и id рубрик, по выбранному id рубрики получаем список подрубрик, послав запрос сюда Перейти по ссылке
    Обратно парсим результат, выбирая названия фирм/предприятий и их id
    Ну и для получения детальной информации по выбранной фирме/предприятию шлем запрос на Перейти по ссылке
    И наслаждаемся полученным результатом.
     
    phillip нравится это.
  3. phillip

    phillip

    Регистр.:
    4 сен 2007
    Сообщения:
    413
    Симпатии:
    15
    короче epic fail. делал делал часа 4, в итоге в самом конце разработки заметил что в онлайновой версии не прилагаются емейлы :(((( Может у кого есть идеи, что делать теперь?
     
  4. saen

    saen

    Регистр.:
    6 авг 2006
    Сообщения:
    756
    Симпатии:
    129
    на c++ можно написать прогу, которая локально будет грабить дублгис. Если мозгов не хватит сделать, могу сграбить за умеренную плату.
     
  5. phillip

    phillip

    Регистр.:
    4 сен 2007
    Сообщения:
    413
    Симпатии:
    15
    умеренная это сколько? ты же знаешь уже примерное тз, скажи сразу и примерную цену
    p.s. предмет обсуждения был под хайдом 100, зачем ты выносишь?
     
  6. diavolic

    diavolic

    Регистр.:
    17 мар 2010
    Сообщения:
    522
    Симпатии:
    102
    я если честно вообще не понял, что там парсить надо? может кто то внятно написать, под любым доступным хайдом?
     
  7. phillip

    phillip

    Регистр.:
    4 сен 2007
    Сообщения:
    413
    Симпатии:
    15
    адреса, телефоны, мыла организаций для формирования базы клиентов
     
  8. saen

    saen

    Регистр.:
    6 авг 2006
    Сообщения:
    756
    Симпатии:
    129

    1000р. за базу по твоему городу. Если заинтересовало, стучи в асю, обсудим детали.
     
  9. Maza

    Maza

    Регистр.:
    3 июл 2007
    Сообщения:
    255
    Симпатии:
    118
    Тебе именно код на php нужен для парсинга или пойдет и любой другой пмрограммой можно? Можно content downloader спарсить
     
    phillip нравится это.
  10. phillip

    phillip

    Регистр.:
    4 сен 2007
    Сообщения:
    413
    Симпатии:
    15
    да парсер сайта я уже сделал, просто в инете нет емейлов :) емейлы есть только в десктопной, офлайновой версии. Теперь и стоит задача распарсить оффлайн версию.
    Прогу твою глянул, она не подойдет) Она же сайты парсит)