Rss Alligator

Хороший парсер?


  • Всего проголосовало
    14
  • Опрос закрыт .
Статус
В этой теме нельзя размещать новые ответы.
Поставлено было в паре мест, проверил - все чисто, никто из чужих не приходил. Может хостеры балуюцца. А может если сунуть эту тему куданить на вход в пайпс - так сразу бот и начинает тянуть.
 
Поставлено было в паре мест, проверил - все чисто, никто из чужих не приходил. Может хостеры балуюцца. А может если сунуть эту тему куданить на вход в пайпс - так сразу бот и начинает тянуть.
хостеры не могут баловаться :) это мой сервер :)
 
В общем

В общем сделаю пару заявлений:
1 - Проблемы типа со стучалкой ток у одного чела.
2 - Там 5 с половиной строчек кода - ну негде там стучалку прятат.
3 - Для тех кто сомневается чуток позже будет релиз без зендов. Чистые сорцы и ничего лишнего. ;)
Скрипт уже сделали еще вчера. ;)

Но не ждите скоро релиза....
 
Проблема с кодировками

сбоит с парсингом руссх фидов, кодировки русские даже в юникоде путаются - членотня полная,
подскажите фиды нормальные или как настроить, может подправить чего можно? ... хотя зенд ...
 
И есть ли смысл раму к алигатору?

И есть ли смысл подключать алигатора к раме? вместе у них получается нечто похожее на парашу, а именно
SonicWALL Email Security View a free flash video demo now. Win in NEC displays. NEW MAXTOR DIAMONDMAX solutions for storing escalating data. HP s BladeSystem c Class empower your business. Looking for deeper business intelligence Turn to Hyperion BI . FREE Webinar from HP Protection. VeriSign intelligent infrastructure services. Sign up today and save . Fill in the form below . Select email format HTML Text only
может настройки протупил? - каша полная, такое осчучение, что это получилась вся страница от тегов откусаная
- то есть заголовком становится анонс, а текстом становится все содержание страницы или ленты вкучу, при этом брал t=one&k=free%20hosting%20servers, что по-мойму должно было уменьшить количество выходного материала?
 
по моим наблюдениям что one что many - один хрен, одинаковая выдача.
Ну а насчет текстов - чегож ты хотел, искуственного интеллекта там явно не прикручено :)
 
В этом проблема

по моим наблюдениям что one что many - один хрен, одинаковая выдача.
Ну а насчет текстов - чегож ты хотел, искуственного интеллекта там явно не прикручено :)

Обещают полную новость, а дают дезглуздый текст страницы, либо склеенные анонсы и заголовки ...

может нужны качественные фиды, а там и аллигатор не нужен, хотя мысль лучше чем реализация.

а насчет "many" или "one" - тут есть НО! если алигатору дать один фид, и попросить "one" - на выходе увидим только такой же анонс бл* как и без него, единственное, он отсеет по кейвуду - нет там полной одной новости- есть полная(склеенная "many") новость!
 
.. на другом субдомене ... эти действия за день мне сгенерировали трафик на >3000 ГБ в сутки ...
3 Терабайта это где-то месячный максимальный траф на 10Мбит порту. Гигабитный порт или объебос?
 
Задам идиотский вопрос. А где ссылка на скрипт?
Вообще меня в нём интересует только одно место - непосредственно то, как они вытаскивают текст статьи из произвольного хтмл-кода. Если есть у кого этот кусок кода без зенда, стукните в аську или пм плиз
 
Задам идиотский вопрос. А где ссылка на скрипт?
Вообще меня в нём интересует только одно место - непосредственно то, как они вытаскивают текст статьи из произвольного хтмл-кода. Если есть у кого этот кусок кода без зенда, стукните в аську или пм плиз
с помощью регулярных выражений, но для каждого фида свои настройки надо юзать. Сам не пользовася этим скриптом, не член клуба :) Если не прав, Зератул поправит
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху