Проблемы в парсере

Статус
В этой теме нельзя размещать новые ответы.

Mxnrl

Постоялец
Заблокирован
Регистрация
29 Апр 2010
Сообщения
50
Реакции
1
  • Автор темы
  • Заблокирован
  • #1
Пока тут разыскиваю парсер, написал аналог:)
В принципе проблема следующая - у человека есть какой-то платный парсер, который отлавливает свежие объявления на авто.ру через 5-10 минут после того как они туда попадают.. Данный скрипт парсит все верно.. Но почему-то свежие объявления парсит с задержкой в ~55 минут. Скрипт весит на кроне и запускается каждые 5 минут..
Посмотрите пожалуйста - в пхп не слишком силен - возможно есть какие-то откровенные ляпы в коде?

Если что-то в коде не понятно - пишите объясню
 
Ну, код выглядит хорошо- так держать !:az:
Первое что бросилось в глаза
PHP:
            if ($db->countRows($db->query("SELECT id FROM autos WHERE unikid = '{$id}' LIMIT 1")) < 1) {

Как я понял- это проверка есть ли машина в базе. Если там идёт сортировка по времени и старое объявление не может попасть в начало, например, после редактирования, то лучше при отрицательном условии прервать скрипт.

А вот по проблеме 2 совета:
- в первый час поступления возможно класс у ссылок другой напр "new-offer-list"
-посмотрите функцию сохранения, возможно она просто ставит будущую\прошлую дату.
- добавить функцию дебага. На каждый запуск создайте папку с датой в имени, туда сохраните саму страницу и информацию, сколько ссылок на ней нашли.
 
  • Автор темы
  • Заблокирован
  • #3
Ну, код выглядит хорошо- так держать !:az:
Сенкс:)

Первое что бросилось в глаза
PHP:
            if ($db->countRows($db->query("SELECT id FROM autos WHERE unikid = '{$id}' LIMIT 1")) < 1) {
Как я понял- это проверка есть ли машина в базе. Если там идёт сортировка по времени и старое объявление не может попасть в начало, например, после редактирования, то лучше при отрицательном условии прервать скрипт.
Верно, проверяем есть авто с таким айди в базе. Прерывать к сожалению нельзя(( там тупая система - нет фильтрации по дате..

А вот по проблеме 2 совета:
- в первый час поступления возможно класс у ссылок другой напр "new-offer-list"
проверял, но вроде все такое же.. хотя в принципе у меня свежак именно на авто.ру отловить так и не получилось. нет фильтрации по дате, а визуально - фиг запомнишь)


-посмотрите функцию сохранения, возможно она просто ставит будущую\прошлую дату.
Не, там просто инсерт

- добавить функцию дебага. На каждый запуск создайте папку с датой в имени, туда сохраните саму страницу и информацию, сколько ссылок на ней нашли.

Ага, сейчас сделаю посмотрю что получится
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху