rssВолшебник

Статус
В этой теме нельзя размещать новые ответы.
он взаправду статьи полные вытягивает?
 
он взаправду статьи полные вытягивает?
Гы-гы) тоже думал что это так круто и невозможно, пока за 5 минут не написал такую парсилку :) В паблик пока не дам, их уже достаточно и так.
 
@Nou:
Ты народ не путай...
Сделать универсальную парсилку полной новости невозможно, или она будет пахать так же как в Аллигаторе(через жопу).
Можно тока сделать настройку плугинами на общеупотребимые движки, что и реализовано в куче аналогов...ну и у тебя наверное.
Универсальная парсилка дает совершенно нечитабельный текст, что бы там не говорили афтары, либо она не-универсальная

@Manitu:
Полную новость он дерет не из тэга "description", а из "content", если тот присутствует, а это бывает очень редко, т.к. нестандарт. А в большинстве случаев он кушает тока сниппеты.
 
@Nou:
Ты народ не путай...
Сделать универсальную парсилку полной новости невозможно, или она будет пахать так же как в Аллигаторе(через жопу).
Можно тока сделать настройку плугинами на общеупотребимые движки, что и реализовано в куче аналогов...ну и у тебя наверное.
Универсальная парсилка дает совершенно нечитабельный текст, что бы там не говорили афтары, либо она не-универсальная
@Manitu:
Полную новость он дерет не из тэга "description", а из "content", если тот присутствует, а это бывает очень редко, т.к. нестандарт. А в большинстве случаев он кушает тока сниппеты.
Существует универсальная парсилка под названием Content Cutter. Скармливаешь ей URL, вытягивает все статьи. Недостаток - тянет только тексты.
 
С чего ты взял что она универсальная? Да она имен пытаетсья выделить основной текст страницы из тегов и прочего муссора, но не всегда ей это тоже удаетсья, хотя так тока говорят, сам не юзал, но я не думаю что там чето такое что стоит, по мойму уже 150 бариков, а рссволшебник, его разве что к доргену прикрутить и только
 
С чего ты взял что она универсальная? Да она имен пытаетсья выделить основной текст страницы из тегов и прочего муссора, но не всегда ей это тоже удаетсья, хотя так тока говорят, сам не юзал, но я не думаю что там чето такое что стоит, по мойму уже 150 бариков, а рссволшебник, его разве что к доргену прикрутить и только
Покупал еще за 90, вполне успешно использую. Тексты дергает на ура, пока не было случаев, чтобы не удалось выделить текст.
Ну а волшебник для связки с доргеном RSS Evolution и затачивался изначально.
 
@dmigga:
Не говори того чего не знаешь, ок?
Внимательно прочти мой верхний пост...повторяю универсальной сделать невозможно, можно тока заточить скрипт на некоторые универсальные двиги и то до смены диза.
Дай своей парсилке за 150 или 90 урл Для просмотра ссылки Войди или Зарегистрируйся
и поймешь о чем я говорю

У меня самого парсер дергает полную новость с 80 или 90 популярных движков, но я же не говорю что он универсальный.
 
@dmigga:
Не говори того чего не знаешь, ок?
Внимательно прочти мой верхний пост...повторяю универсальной сделать невозможно, можно тока заточить скрипт на некоторые универсальные двиги и то до смены диза.
Дай своей парсилке за 150 или 90 урл Для просмотра ссылки Войди или Зарегистрируйся
и поймешь о чем я говорю
У меня самого парсер дергает полную новость с 80 или 90 популярных движков, но я же не говорю что он универсальный.
Говорю именно о том, что знаю и с чем РЕАЛЬНО РАБОТАЮ. Content Cutter свободно распарсивает новостные сайты. Тексты выделяет легко и непринужденно. Единственная проблема первой версии - плохо работает с проектами от 3000 статей (проблема со структурой базы данных. вроде как решена в следующей версии).
Если твоя парсилка не умеет того же - говори за себя. Сам судишь о том, чего не знаешь.
 
@Nou:
Ты народ не путай...
Сделать универсальную парсилку полной новости невозможно, или она будет пахать так же как в Аллигаторе(через жопу).
Можно тока сделать настройку плугинами на общеупотребимые движки, что и реализовано в куче аналогов...ну и у тебя наверное.
Универсальная парсилка дает совершенно нечитабельный текст, что бы там не говорили афтары, либо она не-универсальная
Спорим на 10 баксов, что можно сделать без всяких настроек? :) У меня сейчас только один косяк у скрипта, он иногда хавает статью вместе с авторским текстом. У скрипта всего два параметра для настройки, причём оба принимают только числовые значения.

Добавлено через 8 минут
Гы) Скормил ему урл Для просмотра ссылки Войди или Зарегистрируйся, распарсил всё сразу :) Единственный косяк, там текст в зашифрованном виде выдаётся, поэтому он так же зашифрованным и остался. А приделать дешифратор как делать нефиг
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху