Помогите распарсить

Тема в разделе "PHP", создана пользователем phillip, 17 мар 2011.

Модераторы: latteo
  1. phillip

    phillip

    Регистр.:
    4 сен 2007
    Сообщения:
    413
    Симпатии:
    15

    Помогите распарсить дубль гис! Самому не получается, а так может кому-то тоже надо. С миру по нитке, носки для улитки.

    Что удалось выяснить:
    Если курлом захожу на http://maps.2gis.ru/chelyabinsk/ , не получаю список рубрик. Надо что-то сделать другое(

    Есть рубрики, и есть подрубрики.

    По адресу
    http://maps.2gis.ru/chelyabinsk/rubric-list/rubric/5420/
    Можно получить все подрубрики, из рубрики 5420

    По адресу
    http://maps.2gis.ru/chelyabinsk/firm-list/rubric/717/
    получаем список организаций из подрубрики 717

    По адресу
    http://maps.2gis.ru/chelyabinsk/firm/212843/rub/717/
    получаем инфу фирмы

    Номера рубрик и подрубрик для всех городов одинаковые, в принципе можно сразу составить номера подрубрик какие надо допустим
    Мука / Крупы 2232



    там все через ajax подгружается, я его вообще парсить ладом не умею чот :(
     
  2. stealthdebuger

    stealthdebuger Механик

    Administrator
    Регистр.:
    25 авг 2008
    Сообщения:
    628
    Симпатии:
    1.388

    Для получения списка рубрик шлите запрос сюда http://maps.2gis.ru/chelyabinsk/rubric-list/
    полученное парсим, выбирая названия и id рубрик, по выбранному id рубрики получаем список подрубрик, послав запрос сюда http://maps.2gis.ru/chelyabinsk/rubric-list/rubric/id_рубрики/
    Обратно парсим результат, выбирая названия фирм/предприятий и их id
    Ну и для получения детальной информации по выбранной фирме/предприятию шлем запрос на http://maps.2gis.ru/chelyabinsk/firm/id_фирмы/rub/id_рубрики/
    И наслаждаемся полученным результатом.
     
    phillip нравится это.
  3. phillip

    phillip

    Регистр.:
    4 сен 2007
    Сообщения:
    413
    Симпатии:
    15
    короче epic fail. делал делал часа 4, в итоге в самом конце разработки заметил что в онлайновой версии не прилагаются емейлы :(((( Может у кого есть идеи, что делать теперь?
     
  4. saen

    saen

    Регистр.:
    6 авг 2006
    Сообщения:
    756
    Симпатии:
    129
    на c++ можно написать прогу, которая локально будет грабить дублгис. Если мозгов не хватит сделать, могу сграбить за умеренную плату.
     
  5. phillip

    phillip

    Регистр.:
    4 сен 2007
    Сообщения:
    413
    Симпатии:
    15
    умеренная это сколько? ты же знаешь уже примерное тз, скажи сразу и примерную цену
    p.s. предмет обсуждения был под хайдом 100, зачем ты выносишь?
     
  6. diavolic

    diavolic

    Регистр.:
    17 мар 2010
    Сообщения:
    522
    Симпатии:
    102
    я если честно вообще не понял, что там парсить надо? может кто то внятно написать, под любым доступным хайдом?
     
  7. phillip

    phillip

    Регистр.:
    4 сен 2007
    Сообщения:
    413
    Симпатии:
    15
    адреса, телефоны, мыла организаций для формирования базы клиентов
     
  8. saen

    saen

    Регистр.:
    6 авг 2006
    Сообщения:
    756
    Симпатии:
    129

    1000р. за базу по твоему городу. Если заинтересовало, стучи в асю, обсудим детали.
     
  9. Maza

    Maza

    Регистр.:
    3 июл 2007
    Сообщения:
    255
    Симпатии:
    118
    Тебе именно код на php нужен для парсинга или пойдет и любой другой пмрограммой можно? Можно content downloader спарсить
     
    phillip нравится это.
  10. phillip

    phillip

    Регистр.:
    4 сен 2007
    Сообщения:
    413
    Симпатии:
    15
    да парсер сайта я уже сделал, просто в инете нет емейлов :) емейлы есть только в десктопной, офлайновой версии. Теперь и стоит задача распарсить оффлайн версию.
    Прогу твою глянул, она не подойдет) Она же сайты парсит)