[FreeWare] Парсер marketgid.com

Нужен такой парсер?


  • Всего проголосовало
    4
  • Опрос закрыт .

melmaxx

Постоялец
Регистрация
1 Май 2008
Сообщения
136
Реакции
7
Нужен ли кому-то сей продукт?
Если да, пишите свои пожелания.
Сейчас готово следующее:
Парсим товары и сохраняем .txt/.xls/.dok
Вынимается:
- описание товара
- характеристики товара (если они есть)
- картинка товара
- категория товара
- производитель
- тип
Скрипт однопоточен, зато не банится :)
Что еще нужно?
ЗЫ: по достижении идела, устроившего всех, выложу скрипт в этой теме под хайдом 300 сообщений. Все остальные желающие смогут получить скрипт по символической цене. (20-30уе)
 
Цена! Цену забыл ))

А вообще тут такое дело, что надо смотреть. Пока не посмотришь - и пожеланий особо не будет. Ты бы выложил свой теперешний скрипт как "альфа-версию", а потом бы подредактировал пост и заменил ссылку на "нормальную".

Ну или на худой конец пример *.xls дай. Но вообще такую вещь надо тестить.
 
ну интерфейса как такового пока нет. Точнее есть одна кнопка - СТАРТ.
Пример xls зачем? скажи в каком виде лично для тебя нужно отдавать - я сделаю :)

Сегодня дописываю к парсеру еще 1 сайт. Форумчанин попросил grand.ua и rozetka.ua.
Пока логика будет такая:
Получили товар на маркетгиде, пошли поискали описание и характеристики на grand.ua и rozetka.ua. Все сграбили и соединили.
Часто-повторяющиеся вхождения словосочетаний/слов в тексте обернули в теги <strong>, <em>
 
Как он парсит? Что берет для входных данных? Ну типа указываешь ли ты ему ключевики, категорию, диапазон ID товаров.. Что?

Если ключевики, то по какому алгоритму он их потом на marketgid'е вылавливает? Жмет кнопку "search" там? Или парсит все подрят и отбрасывает не содержащие ключевиков товары?

Короче, интересуют подробности.
 
Диапазон ID - это все входящие данные для маркедгида. Дальше по названию товаров делается поиск и на 2-х других сайтах. (их можно тоже парсить по диапазону ID).
 
было бы здорово, если бы скрипт на выходе давал csv файл в кодировке utf-8
 
а как он будет с гранд.юа и розетки брать описание, точнее как он будет соединять, если описания будут для товара и там и там? Будет дублировать одно и тоже в случаи одинакового?
 
От себя хотел бы добавить, что хорошо было бы если был фильтр по датам, парсились еще и картинки, и возможно, что-то вроде превьюхи товаров перед парсингом, чтобы можно было отменить парсинг чего-то
 
Мне как для психолога интересна была бы привязка товара по рекламе или новостям, по слоганам по которым они двигают товар. Изначально же идешь на новость, а потом уже подсовывают товар.
 
Назад
Сверху