Грабилка новостей с сайтов ищется

Статус
В этой теме нельзя размещать новые ответы.
У кого-нибудь есть скриптик, а может программка типа _http://www.simple-soft.ru/AdAuto.htm для снятия информации с досок объявлений с любого URL. Или может быть кто-нибудь возмется сделать (небесплатно).

Как смонтировать NG или Content master в Joomla, чтобы оставить свой сайт, шаблон... ?
Заливаешь скрипт или CMS рядом с joom, открывешь в админке wrapper вставляешь URL. И работает.
 
  • Заблокирован
  • #42
Заливаешь скрипт или CMS рядом с joom, открывешь в админке wrapper вставляешь URL. И работает.

Есть более простой и удобный вариант Для просмотра ссылки Войди или Зарегистрируйся
новости парсятся с базу а дальше твори что хочеш. Выводятся в любом масте шаблона, вписаны в дизайн:D
 
  • Заблокирован
  • #44
Alex_D + НА DLE сейчас появился свой собственный NG так что лучший выбор
 
тут два варианта:
1) надо затягивать rss.
тогда подойдет sapid и тому подобные софты (ищется гуглом)
2) надо затягивать контент с других хтмл-страниц без рсс-выгрузки.
В этом случае нужно делать парсер страниц на регэкспах и паука, который сможет обходить страницу за страницей

Если нужен второй вариант, то уже недавно делался такой заказной софт, который затачивался под определенные запароленные сайты, переводил контент и делал прочие приятные вещи. Обращайся, если нужно будет
 
Грабилка

Вот обалденные грабли: только стоит сей продукт довольно прилично!
 
Вот обалденные грабли:
только стоит сей продукт довольно прилично!

Прикол грабли в открытой продаже с интерфейсом для чайников (по из словам) ;)
А вообще, кстати не уверен, что такая универсальная софтина может настроиться под любой сайт...

По своему опыту могу сказать, что очень часто бывает такое, что нужно не просто тупо парсить указанный урл по расписании и даже не бегать по дереву страниц сайта и читать их все, а делать более сложные операции:
- заполнять поля формочки, выбирать элементы из списков
- нажимать на кнопки
- брать выдачу, ходить по ней внутрь на несколько уровней, чтобы вытащить все характеристики найденного объекта (скажем, "лота" или "товара")
а потом уже пихать это всё к нам в базу в нужном нам формате

Так что я как пользовался своими разработками в этой области, так и буду.
Хотя если нужно элементарно тянуть рсс и тырить отдельные страницы по расписанию, то и универсальный двиг подойдет. Только лучше фришный найти :)
 
Ну для новостного портальчика, как нельзя лучше подходит, вот вроде на Ньюстреке работает, оч. даже ничего тягает новости, даже с картиночками :)
 
zevgen, ты немного опоздал - хайдовые ссылки тут уже сдохли.
Если надо что-то скачать, стучи в личку к тем, кто выкладывал интересующие тебя ссылки.
Или пользуйся тем, что без хайда. А лучше гуглом.
вот тебе даже ссылка почти без хайда на гугль, а дальше смотри уж сам (надеюсь, админы простят слабохайдовую ссылку на гугль-то ;) )

 
Универсальный

Я так понял, что универсальных грабилок контента не существует, есть только под конкретные сайты доноры или я не прав?
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху