Newstrack

Cimmerian · 3 Дек 2008

Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.

arp · 3 Дек 2008

Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.

Cimmerian · 3 Дек 2008

Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.

Goldcalf · 3 Дек 2008

Cimmerian, а вот эта прога:
HTTrack Website Copier 3.42-2
случаем не аналог твоей?
Или это абсолютно разные вещи?

Cimmerian · 3 Дек 2008

нет, HTTrack Website Copier 3.42-2 это офлайн броузер, а Newstrack - грабер+постер, причём универсальный и в том и в другом: источники обрабатывает любые после настройки на код страницы, парсит в любую базу, как настроишь. при этом следит за обновлениями на сайтах, и при появлении новые материалы автоматом (если указано) сливает, и (если задано) парсит, либо оставляет на обработку админом. это что-то типа redtram.ru (сдаётся мне, разраб упоминал, что рэдтрэм именно на этом двиге и сделан. 100% не дам, но очень похоже).

ants · 3 Дек 2008

вопрос к ТС: какая версия скрипта у вас? сходу в коде не нашел упоминаний о версии. по докам вроде как 3.1, но все же? Эта версия парсит веб-страницы или только с фидами работает?
на сайте ньюстракер.ру продается версия 5 за $550 у которой, судя по описанию, осталась только обработка фидов.

Cimmerian · 3 Дек 2008

версия старая, возможно 3.1, делает всё - и грэббинг, и парсинг.
это была последняя продажа разраба перед тем, как он продал весь проект целиком (по-моему рэдтрэму, но могу и ошибиться). очевидно в связи с новыми условиями (с новыми владельцами скрипта), разраб был вынужден написать что-то новое с урезанными функциями.
деталей я не знаю, одно могу сказать - версия полная, и делает всё.

p.s. немного не понял, что значит "парсит веб-страницы". по-нормальному это означает генерацию html-кода по собранным материалам. думаю, имелось в виду другое - граббинг не только рсс-лент, но им html-страниц. если так, то да, забирает контент всё равно откуда, и обрабатывает не только новости, но может и весь сайт прогнать. в отношении парсинга - настраивается вывод в базу, и куда именно. то есть можно парсить в конкретные таблицы мускульной базы так, чтобы они автоматом появлялись, например, в блоге.

p.p.s. когда ньюстрэк начинали разрабатывать, рсс-лент ещё не было, на момент покупки этой конкретной версии они тольо-только начинали использоваться. так что весь ньюстрэк изначально планировался как средство сбора информации именно с хтмл-страниц.

ants · 3 Дек 2008

Cimmerian написал(а):
граббинг не только рсс-лент, но им html-страниц. если так, то да, забирает контент всё равно откуда, и обрабатывает не только новости, но может и весь сайт прогнать. в отношении парсинга - настраивается вывод в базу, и куда именно. то есть можно парсить в конкретные таблицы мускульной базы так, чтобы они автоматом появлялись, например, в блоге.

супер
посмотрю сегодня
а возможен вариант, что установка не работает по причине деактивированной лицензии? какая то защита же должна была быть у скрипта от нелегального распространения...

uselessuser · 3 Дек 2008

это тот скрипт что инферно толкал/толкает?

Cimmerian · 3 Дек 2008

про инферно я ничего не знаю.
про защиту - не помню, если там лицензия, то она есть. но, думаю, что скрипт распространялся без специальной защиты, как это принято на западе.
не устанавливается не по причине защиты, или нарушения оной, а именно в силу того, что изменилась среда (с пхп4 на пхп5). он ещё на момент покупки был не шибко-то коробочным продуктом - без приложения сил разраба для установки после покупки не обходилось. но в конечном итоге всё настраивалось. работало оно под фрёй5+мускул4+рхр4. при появлении пхп5 работать (устанавливаться и работать) перестало, и сейчас под фрёй7+мускул5+пхп5 не идёт.

Добавлено через 2 минуты

ants написал(а):
на сайте ньюстракер.ру продается версия 5 за $550 у которой, судя по описанию, осталась только обработка фидов.

думаю, тут на самом деле непонимание. скорее всего под фидами они понимают просто источники, коими могут быть рсс-ленты, хтмл-новости, или просто страницы сайтов. когда ньюстрэкеру формируется задание на сбор инфорамции, эти источники оформляются в то, что разрабы ньюстрэка назвали "фидами". может быть, не очень удачно они это придумали, поскольку со стороны сразу не понять, но, думаю, речь идёт именно про это.

Newstrack

Cimmerian

Читатель

arp

Постоялец

Cimmerian

Читатель

Goldcalf

Постоялец

Cimmerian

Читатель

ants

Профессор

Cimmerian

Читатель

ants

Профессор

uselessuser

школьные носилки

Cimmerian

Читатель