Парсер ядекса

  • Автор темы webrazrabot4ik
  • Дата начала
Статус
В этой теме нельзя размещать новые ответы.
W

webrazrabot4ik

Прохожие
Никто не писал парсер результатов поисковых запросов на яндексе?

Я заметил там такую фигню - в УРЛ запроса есть параметр "q" который является числом. Вот этот параметр переодически меняет своё значение при листинге результатов...

Вопрос: чт за параметр, как его обойти?
Т.к. когда парсю страницы, и если параметр не совпадает (по мнению яндекса) он выдаёт пустые страницы и якобы был пустой запрос!
 
webrazrabot4ik написал(а):
Никто не писал парсер результатов поисковых запросов на яндексе?

Я заметил там такую фигню - в УРЛ запроса есть параметр "q" который является числом. Вот этот параметр переодически меняет своё значение при листинге результатов...

Вопрос: чт за параметр, как его обойти?
Т.к. когда парсю страницы, и если параметр не совпадает (по мнению яндекса) он выдаёт пустые страницы и якобы был пустой запрос!
а вот тут
Для просмотра ссылки Войди или Зарегистрируйся
хороший ман
 
та не.... это не то.. Мне не нужно смотреть переходы с поисковиков.. Мне нужно забирать все поисковые результаты яндекса...
 
webrazrabot4ik написал(а):
та не.... это не то.. Мне не нужно смотреть переходы с поисковиков.. Мне нужно забирать все поисковые результаты яндекса...
Регулярные выражение и вперёд с песнями.
 
для Яши уже парсера четыре написал, никаких проблем.
выкладывай свой парсер посмотрим в чем проблема
 
Вообще не понимаю в чём проблемы,:) . Берёшь курл, и парсишь результат на регулярные выражения, задача на 12 строк php.
 
  • Заблокирован
  • #7
webrazrabot4ik написал(а):
Никто не писал парсер результатов поисковых запросов на яндексе?

Я заметил там такую фигню - в УРЛ запроса есть параметр "q" который является числом. Вот этот параметр переодически меняет своё значение при листинге результатов...

Вопрос: чт за параметр, как его обойти?
Т.к. когда парсю страницы, и если параметр не совпадает (по мнению яндекса) он выдаёт пустые страницы и якобы был пустой запрос!

пробуй
 
HeavyHell написал(а):
*** скрытое содержание ***
пробуй
так это парсер директа..

То шо регуляки - не спорю... Дружу.. Но вот проблема заключается в том, шо яндекс генерерит уникальный код, который гетом передаёт... и как он генерерится и на какм этапе поиска меняется это остаётся загадкой... Т.е. если в параметрах поиска просто задавать один поисковый запрос - 1-2 страницы проходим - потом пустота... проверям на каком урле остановились.. смотрим - в результатах поиска вообще пуста страница...

ну то ладно.. чуть позже буду разбираться.. сейчас надо с той шо етсь базой разобраться..
 
да ничего не генерируются
точнее есть параметр $q но его можно использовать одинаковый
к примеру у меня везде стоит

Для просмотра ссылки Войди или Зарегистрируйся

где $numberpage - номер просматриваемой страницы
$end - собственно сам запрос

проверить просто
заменяем параметры на 2 и test

Для просмотра ссылки Войди или Зарегистрируйся
 
webrazrabot4ik написал(а):
Никто не писал парсер результатов поисковых запросов на яндексе?

Я заметил там такую фигню - в УРЛ запроса есть параметр "q" который является числом. Вот этот параметр переодически меняет своё значение при листинге результатов...

Вопрос: чт за параметр, как его обойти?
Т.к. когда парсю страницы, и если параметр не совпадает (по мнению яндекса) он выдаёт пустые страницы и якобы был пустой запрос!
Просто парсишь HTML код, ищешь новое значение этого параметра и передаешь это новое значение в качестве параметра яндексу.

Добавлено через 2 минуты
untwist написал(а):
да ничего не генерируются
точнее есть параметр $q но его можно использовать одинаковый
к примеру у меня везде стоит

Для просмотра ссылки Войди или Зарегистрируйся

где $numberpage - номер просматриваемой страницы
$end - собственно сам запрос

проверить просто
заменяем параметры на 2 и test

Для просмотра ссылки Войди или Зарегистрируйся
Вряд ли яндекс сделал этот параметр просто для красоты и рано или поздно использование одного и того же значение приведет к неработоспособности скрипта. Лучше все же эмулировать работу браузера и определять значение параметра анализируя код формы яндекса.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху