NewsGrabberJC_by_Samagonische 1.0.0

Тема в разделе "NewsGrabberJC", создана пользователем Samagonische, 3 мар 2010.

Статус темы:
Закрыта.
  1. Samagonische

    Samagonische Создатель

    Регистр.:
    16 июл 2007
    Сообщения:
    28
    Симпатии:
    15
    Здравствуйте.
    Недавно встала проблема парсинга полных новостей из RSS в Joomla 1.5, перерыв весь рунет нашел только устаревший NewsGrabberJC_1.0.6.

    Решил его доработать. После долгих танцев с бубном я заставил его парсить полные новости.

    Для работа парсера требуется включить режим совместимости (Legacy Mode).
    Как его включить читать тут.
    Ленты на которых я отлаживал компонент и они у меня парсятся:
    http://gameplanet.by/component/option,com_rss/feed,RSS2.0/no_html,1/
    Начальная точка: <\/p><\/div><\/div>
    Конечная точка: <br\/><br \/>
    http://games.aplus.by/rss.xml
    Начальная точка: <td class=\"post-story\">
    Конечная точка: <\/div><\/td>

    Ленты работают с такими настройками:
    Допущена: Да (у меня работает)
    Встречаются хотя бы (раз:( (не проверял)
    Загружать только если найдены слова (слова через запятую:( (не проверял)
    Встречаются не менее (раз:( (не проверял)
    Не загружать, если ссылка содержит слова (слова через запятую:( (не проверял)
    Загружать только если ссылка содержит слова (слова через запятую:( (не проверял)
    Публиковать новости автоматически: Да (у меня работает)
    Допускать на главную страницу: Да (у меня работает)
    Допускать на главную, если найдены слова (слова через запятую:( (не проверял)
    Встречаются не менее (раз:( (не проверял)
    Не допускать на главную, если найдены слова (слова через запятую:( (не проверял)
    Встречаются хотя бы (раз:( (не проверял)
    Вставлять произвольный HTML в тело новости: Нет (не проверял)
    Произвольный HTML: (не проверял)
    Позиция HTML-кода: (не проверял)
    Заданная точка: (не проверял)
    Вставлять произвольный HTML в анонс: Нет(не проверял)
    Произвольный HTML: (не проверял)
    Позиция HTML-кода: (не проверял)
    Использовать автоматический frontend/cron импорт: Да (у меня работает)
    Интервал frontend/cron импорта (минуты:( (не проверял)
    Вырезать картинки из анонса: Нет (не проверял)
    Не загружать, если только заголовок: Нет (не проверял)
    Урезать анонс (# символов:( (на ваше усмотрение можно ввести до 999) (у меня работает)
    Максимальное количество элементов для загрузки: (на ваше усмотрение) (у меня работает)
    Срок жизни новости (дни:( (не проверял)
    Максимальная ширина картинки (пиксель:( (не проверял)
    Максимальная высота картинки (пиксель:( (не проверял)
    Выключка картинок текста новости: Нет (не проверял)
    Максимальная ширина картинки анонса (пиксель:( (не проверял)
    Максимальная высота картинки анонса (пиксель:( (не проверял)
    Выключка картинок анонса: Нет (не проверял)
    Копировать полный текст новости: Да (проверенно)
    Использовать оригинальный анонс: Да (проверенно)
    Считать началом заголовок: Нет (не проверял)
    Считать концом подпись автора: Нет (не проверял)

    Для автоматического импорта поставьте на Cron automaticimport.php (у меня работает)

    Парсер у меня работает с такими глобальными настройками(всё, что выключено на работоспособность не проверял:(

    Настройки:
    ___Простые___
    Максимальное время выполнения:
    Отправлять отчет по email: Нет
    Тема письма:
    Письмо как HTML: Нет
    Порядок работы парсеров: DOMIT->Magpie->PEAR (сейчас работает только парсер DOMIT т.к Magpie устарел)
    __Содержимое__
    Исходящая кодировка: UTF-8 (у меня кодировка базы и сайта UTF-8, на cp1251 не проверял если у кого есть возможность проверьте и отпишите)
    Включить ссылки: Нет
    Сложные ссылким: Нет
    Текст ссылки:
    Префикс href якоря:
    Поведение якоря: None
    Произвольный фрэйм:
    Очистить XHTML: Нет
    Паковать картинки в якоря: Нет
    Аттрибут href якоря:
    Другие аттрибуты якоря:
    Сохранить псевдоним автора: Нет
    Если автор не установлен: Использовать заголовок
    Псевдоним по умолчанию:
    __Meta__
    Обсчитывать мета-тэги: Нет
    Использовать Yahoo Term Extraction: Нет
    Идентификатор приложения Yahoo:
    Максимальное количество тэгов:
    Минимальное количество символов в тэге:
    Использовать игнор-лист: Нет
    Файл игнор-листа: Англиский
    Сохранять категории ленты: Нет Да
    Сохранять секцию/категорию: Нет Да

    Есть проблема с которой ещё предстоит разобраться(проблем конечно много, но всё по порядку :) ) в настройках ленты при утановке "Начальной точка:" , "Конечной точка:" и всех шаблонов замены при сохранении изменений скрипт каждый раз экранирует backslash т.е

    Есть:
    Насальная точка: <td class=\"post-story\">
    Конечная точка: <\/div><\/td>

    При сохранении в базу положится:
    Насальная точка: <td class=\\"post-story\\">
    Конечная точка: <\\/div><\\/td>

    При следующем сохранении положит:
    Насальная точка: <td class=\\\"post-story\\\">
    Конечная точка: <\\\/div><\\\/td>
    и так за каждим разом он будет прибавлять backslash.

    Посему я эти данные редактировал прямо в базе данных через phpMyAdmin или другую программу для работы с MySql.

    Таблица: префикс_ newsgrabberjc
    Начальная точка: fromPoint
    Конечная точка: toPoint

    P.S. Если есть вопросы, пожелания, предложения и возможность поддержать работу морально и материально стучите в личку или в ICQ 335582718

    com_NewsGrabberJC_by_Samagonische_1.0.0.zip
     
  2. smashQ

    smashQ Создатель

    Регистр.:
    10 мар 2010
    Сообщения:
    23
    Симпатии:
    9
    Попробовал, но пока ничего не получается - отсутствует кнопка "Импорт". Кроме того, вкладка "Управление лентами" отображается кракозябрами. А, вот вкладки "Настройка" и "FAQ" отображаются правильно. В чем причина и как єто исправить? Но, главное, как грабить новости в ручную, если отсутствует кнопка "Импорт"?
     
  3. smashQ

    smashQ Создатель

    Регистр.:
    10 мар 2010
    Сообщения:
    23
    Симпатии:
    9
    Да, подтверждаю! Совсем не берет новости. Получилось один раз заставить ее работать - получил только фотки: ни заглавий новостей, ни анонсов, ни тем более полных новостей. Последующие попытки вообще ним к чему не привели:bn:
     
  4. hermaster

    hermaster Постоялец

    Регистр.:
    28 июл 2008
    Сообщения:
    87
    Симпатии:
    6
    перезалейте плиз, если версия рабочая была... =)
     
  5. EvilsMoney

    EvilsMoney Создатель

    Регистр.:
    30 апр 2007
    Сообщения:
    14
    Симпатии:
    1
    А как насчет требований к хосту? надо какие-то особые модули пхп? и вообще, на сколько данный скрипт грузит систему... а то гляди, хостер за напряги сервака забанит)
     
  6. smashQ

    smashQ Создатель

    Регистр.:
    10 мар 2010
    Сообщения:
    23
    Симпатии:
    9
    Эта версия скрипта не работает, по крайней мере у меня. Автор обещает выложить обновленную версию, в которой будут исправлены известные баги. Так что ждем...
     
  7. Maks.KV

    Maks.KV Постоялец

    Регистр.:
    21 дек 2009
    Сообщения:
    77
    Симпатии:
    12
    smashQ, а автор не говорил когда он планирует выложить сие чудо?
    как бы не оставил он эту идею :smmne:
     
  8. smashQ

    smashQ Создатель

    Регистр.:
    10 мар 2010
    Сообщения:
    23
    Симпатии:
    9
    С автором я общался месяца полтора-два назад. Когда будет выкладывать обновленную версию он не сказал, только пообещал, что скоро сделает это. Так, что давайте попросим все автора чтобы он выложил обновленную версию по-скорее
     
    bork75 нравится это.
  9. bork75

    bork75 Д☼брая собака )

    Регистр.:
    21 июн 2008
    Сообщения:
    1.449
    Симпатии:
    716
    Прошло два месяца, на какой стадии грабер?

    Данный релиз меня устраивает кроме режима Legacy, он реально добавляет тормозов на страничках с большим количеством изображений с применением Нighslide.

     
  10. anndrrey84

    anndrrey84 Писатель

    Регистр.:
    15 июн 2010
    Сообщения:
    5
    Симпатии:
    1
    И как вы прикрутили NewsGrabberJC_1.0.6 к joomle 1.5? Он даже не ставится, и в legacy тоже. Есть News Writer v1.0, все супер но на localhost. На сайт не граббит так как нету доступа к БД с моего ip, а хостер его даёт только в исключительных случаях.
     
Статус темы:
Закрыта.