Парсер ядекса

  • Автор темы webrazrabot4ik
  • Дата начала
Статус
В этой теме нельзя размещать новые ответы.
Можно пачками IP проксей регистрировать :)
А вообще XML будет менее удобен т.к. у яндекса он такую структура имеет, что для большинства проще HTML парсить.
 
перезалейте yandexDirectParser.zip
 
Нужен парсер яндекса! перезалейте плз!
 
Пользуюусь этим уже полгода мне хватает. Написал за минут 10
 
Я заметил там такую фигню - в УРЛ запроса есть параметр "q" который является числом. Вот этот параметр переодически меняет своё значение при листинге результатов...

Вопрос: чт за параметр, как его обойти?
Т.к. когда парсю страницы, и если параметр не совпадает (по мнению яндекса) он выдаёт пустые страницы и якобы был пустой запрос!
При каждом запросе к яндексу подставляй 0 в этот параметр. таким образом ты нулишь id твоей сессии в яндексе по данному запросу и он тебе отдаст все что пожелаешь ;) У меня так парсилка беков работает. :)
 
Пользуюусь этим уже полгода мне хватает. Написал за минут 10
Чего-то здесь не хватает. Пишет
Warning: file_get_contents(1.htm) [function.file-get-contents]: failed to open stream: No such file or directory in z:\home\yaparser\www\yandex_parser.php on line 9
 
Чего-то здесь не хватает. Пишет
Warning: file_get_contents(1.htm) [function.file-get-contents]: failed to open stream: No such file or directory in z:\home\yaparser\www\yandex_parser.php on line 9
скрипт автоматом не таскает страницы с яндекса. просто т.к. у меня объемы не большие я вот что делаю:
вбиваю запрос в яндексе в расширенном поиске, делаю чтобы показывалось по 50 урлов на страницу прохожу 5 - 6 страниц и все поочередно сохраняю в какую либо папку потом через ком. строку эти файлы объеденяю в один файл вот так
for %i in (*.htm) do type "%i" >> 1.htm
получившийся 1.htm сую в папку со скриптов. все. после запуска скрипта он выдаст в файл и в браузер урлы выдранные из 1.htm
 
Какой пароль на архив?!?! А то нужен очень!
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху