Newstrack

Статус
В этой теме нельзя размещать новые ответы.
Cimmerian, а вот эта прога:
HTTrack Website Copier 3.42-2
случаем не аналог твоей?
Или это абсолютно разные вещи?
 
  • Автор темы
  • Заблокирован
  • #5
нет, HTTrack Website Copier 3.42-2 это офлайн броузер, а Newstrack - грабер+постер, причём универсальный и в том и в другом: источники обрабатывает любые после настройки на код страницы, парсит в любую базу, как настроишь. при этом следит за обновлениями на сайтах, и при появлении новые материалы автоматом (если указано) сливает, и (если задано) парсит, либо оставляет на обработку админом. это что-то типа redtram.ru (сдаётся мне, разраб упоминал, что рэдтрэм именно на этом двиге и сделан. 100% не дам, но очень похоже).
 
вопрос к ТС: какая версия скрипта у вас? сходу в коде не нашел упоминаний о версии. по докам вроде как 3.1, но все же? Эта версия парсит веб-страницы или только с фидами работает?
на сайте ньюстракер.ру продается версия 5 за $550 у которой, судя по описанию, осталась только обработка фидов.
 
  • Автор темы
  • Заблокирован
  • #7
версия старая, возможно 3.1, делает всё - и грэббинг, и парсинг.
это была последняя продажа разраба перед тем, как он продал весь проект целиком (по-моему рэдтрэму, но могу и ошибиться). очевидно в связи с новыми условиями (с новыми владельцами скрипта), разраб был вынужден написать что-то новое с урезанными функциями.
деталей я не знаю, одно могу сказать - версия полная, и делает всё.

p.s. немного не понял, что значит "парсит веб-страницы". по-нормальному это означает генерацию html-кода по собранным материалам. думаю, имелось в виду другое - граббинг не только рсс-лент, но им html-страниц. если так, то да, забирает контент всё равно откуда, и обрабатывает не только новости, но может и весь сайт прогнать. в отношении парсинга - настраивается вывод в базу, и куда именно. то есть можно парсить в конкретные таблицы мускульной базы так, чтобы они автоматом появлялись, например, в блоге.

p.p.s. когда ньюстрэк начинали разрабатывать, рсс-лент ещё не было, на момент покупки этой конкретной версии они тольо-только начинали использоваться. так что весь ньюстрэк изначально планировался как средство сбора информации именно с хтмл-страниц.
 
граббинг не только рсс-лент, но им html-страниц. если так, то да, забирает контент всё равно откуда, и обрабатывает не только новости, но может и весь сайт прогнать. в отношении парсинга - настраивается вывод в базу, и куда именно. то есть можно парсить в конкретные таблицы мускульной базы так, чтобы они автоматом появлялись, например, в блоге.
супер
посмотрю сегодня
а возможен вариант, что установка не работает по причине деактивированной лицензии? какая то защита же должна была быть у скрипта от нелегального распространения...
 
это тот скрипт что инферно толкал/толкает?
 
  • Автор темы
  • Заблокирован
  • #10
про инферно я ничего не знаю.
про защиту - не помню, если там лицензия, то она есть. но, думаю, что скрипт распространялся без специальной защиты, как это принято на западе.
не устанавливается не по причине защиты, или нарушения оной, а именно в силу того, что изменилась среда (с пхп4 на пхп5). он ещё на момент покупки был не шибко-то коробочным продуктом - без приложения сил разраба для установки после покупки не обходилось. но в конечном итоге всё настраивалось. работало оно под фрёй5+мускул4+рхр4. при появлении пхп5 работать (устанавливаться и работать) перестало, и сейчас под фрёй7+мускул5+пхп5 не идёт.


Добавлено через 2 минуты
на сайте ньюстракер.ру продается версия 5 за $550 у которой, судя по описанию, осталась только обработка фидов.

думаю, тут на самом деле непонимание. скорее всего под фидами они понимают просто источники, коими могут быть рсс-ленты, хтмл-новости, или просто страницы сайтов. когда ньюстрэкеру формируется задание на сбор инфорамции, эти источники оформляются в то, что разрабы ньюстрэка назвали "фидами". может быть, не очень удачно они это придумали, поскольку со стороны сразу не понять, но, думаю, речь идёт именно про это.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху