Парсер ядекса

  • Автор темы webrazrabot4ik
  • Дата начала
Статус
В этой теме нельзя размещать новые ответы.
скрипт автоматом не таскает страницы с яндекса. просто т.к. у меня объемы не большие я вот что делаю:
вбиваю запрос в яндексе в расширенном поиске, делаю чтобы показывалось по 50 урлов на страницу прохожу 5 - 6 страниц и все поочередно сохраняю в какую либо папку потом через ком. строку эти файлы объеденяю в один файл вот так
for %i in (*.htm) do type "%i" >> 1.htm
получившийся 1.htm сую в папку со скриптов. все. после запуска скрипта он выдаст в файл и в браузер урлы выдранные из 1.htm

Что-то я не совсем понял для чего этот скрипт вообще нужен? Что он парсит? Зачем собирать УРЛы?
 
Что-то я не совсем понял для чего этот скрипт вообще нужен? Что он парсит? Зачем собирать УРЛы?

Парсятся страницы выдачи Яндекса, которые надо сохранить в папку как я писал в предыдушем посте, выдираются урлы из этих самых страниц.
 
гыгы, а что нельзя было сделать чтобы через курл он получал эти страницы так намного больше и быстрее можно напарсить
 
Кто-нибудь может сделать, чтобы в ЯндексДирект парсере результаты сохранялись не в .тхт, а в .csv файл?
 
Может кто-нибудь сделать так, чтобы ЯндексДирект парсер работал через прокси?
 
Странно, в логах моих хитрых скриптов, выполняющих подобные функции, и замечающих изменения структуры запросов и страниц, такого параметра вообще не встречается.
Хотя я парсил не yandex.ru/yandpage а yandex.ru/yandsearch..
 
а в чем проблема сделать самому сохранение, в cvs в скрипте выбирите нужный тип сохранения и в каком формате записывать
 
а в чем проблема сделать самому сохранение, в cvs в скрипте выбирите нужный тип сохранения и в каком формате записывать

Если не трудно, покажи в каком конкретно месте. А то в ПХП не очень силен.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху