Мануал по настройке рсс каналов

Тема в разделе "NewsGrabber", создана пользователем Pricol, 19 окт 2006.

  1. Pricol

    Pricol Прохожие

    Приветствую

    Вопрос следуюбщего характераЁ

    Как настраивать в грабере корректное грабание через РСС каналі?

    то есть кто поделится советами и примерами на русские новостные сайты а не на забегорные которые есть в движке?
     
  2. someone

    someone сисадмин всея 0ed

    Administrator
    Регистр.:
    3 апр 2006
    Сообщения:
    330
    Симпатии:
    373
    Настройка русских лент ничем не отличается от зарубежных.
    Все аналогично.

    в доке (что из форума) все почти расписано

    Единственное в доке надо было дать пример регекспа замены урла на "версию для печати"
    Вот часто встречающийся случай:

    Страница для печати
    Код:
    /news/([0-9]+).html
    менять на
    Код:
    /news/print.pl?id=$1
     
    Rust aka -=S.V.D=-, T@R@S и eternal_outcast нравится это.
  3. Name

    Name Прохожие

    ну вот пример:
    1. Лента, одна штука... Например, эта: http://shareleecher.com/component/option,com_rss/feed,RSS2.0/no_html,1/
    2. Добавляем в админке РСС-канал новый
    3. Редактириум, по-шагам :)
    4. Берем кусок из ленты:
    Код:
    [URL="http://shareleecher.com/component/option,com_rss/feed,RSS2.0/no_html,1/#"][B][FONT=Courier New][COLOR=#ff0000]-[/COLOR][/FONT][/B][/URL] [COLOR=#0000ff]<[/COLOR][COLOR=#990000]item[/COLOR][COLOR=#0000ff]>[/COLOR]
    [B][FONT=Courier New][COLOR=#ff0000] [/COLOR][/FONT][/B] [COLOR=#0000ff]<[/COLOR][COLOR=#990000]title[/COLOR][COLOR=#0000ff]>[/COLOR][B]P. Diddy - Press Play (2006)[/B][COLOR=#0000ff]</[/COLOR][COLOR=#990000]title[/COLOR][COLOR=#0000ff]>[/COLOR] 
    
    [B][FONT=Courier New][COLOR=#ff0000] [/COLOR][/FONT][/B] [COLOR=#0000ff]<[/COLOR][COLOR=#990000]link[/COLOR][COLOR=#0000ff]>[/COLOR][B][url]http://shareleecher.com/content/view/401/49/[/url][/B][COLOR=#0000ff]</[/COLOR][COLOR=#990000]link[/COLOR][COLOR=#0000ff]>[/COLOR] 
    
    [B][FONT=Courier New][COLOR=#ff0000] [/COLOR][/FONT][/B] [COLOR=#0000ff]<[/COLOR][COLOR=#990000]description[/COLOR][COLOR=#0000ff]>[/COLOR][B]Новый альбом известного рэп-артиста.[/B][COLOR=#0000ff]</[/COLOR][COLOR=#990000]description[/COLOR][COLOR=#0000ff]>[/COLOR] 
    
    [B][FONT=Courier New][COLOR=#ff0000] [/COLOR][/FONT][/B] [COLOR=#0000ff]<[/COLOR][COLOR=#990000]category[/COLOR][COLOR=#0000ff]>[/COLOR][B]Обновления - Музыка[/B][COLOR=#0000ff]</[/COLOR][COLOR=#990000]category[/COLOR][COLOR=#0000ff]>[/COLOR] 
    
    [B][FONT=Courier New][COLOR=#ff0000] [/COLOR][/FONT][/B] [COLOR=#0000ff]<[/COLOR][COLOR=#990000]pubDate[/COLOR][COLOR=#0000ff]>[/COLOR][B]Thu, 19 Oct 2006 12:10:57 +0100[/B][COLOR=#0000ff]</[/COLOR][COLOR=#990000]pubDate[/COLOR][COLOR=#0000ff]>[/COLOR]
    [COLOR=#0000ff]</<[/COLOR][COLOR=#990000]item[/COLOR][COLOR=#0000ff]>[/COLOR]
    gfМеняем ненужное нам содержание тэгами:
    {title}{link}{text}, остальное (все что не нужно) заменяем на тэг {skip}
    6.Получившийся шаблон вставляем в окошко "Шаблон заголовков"
    7ю Сохраняем, обновляем... Должно все работать
     
  4. someone

    someone сисадмин всея 0ed

    Administrator
    Регистр.:
    3 апр 2006
    Сообщения:
    330
    Симпатии:
    373
    не, это некрасиво.
    рсс он и так обрабатывает. без шаблона рсс-ленты.
    просто указываешь какое поле в рсс отвечает за что.

    там же в админке написано

    Шаблон заголовков
    Если задан, лента интерпретируется как html, а не rss:

    то есть это поле для РСС лент не заполняйте

    PS: читайте доки, они рулят !
    http://www.nulled.ws/showthread.php?t=4186
     
  5. Name

    Name Прохожие

    в том-то и дело, что в большинстве случаев, у новостных лент вся выдача через PHP... да и сами XML, если шаблоны не задавать, он не очень тщательно разбирает... :(
     
  6. Pricol

    Pricol Прохожие

    Возникает такте вопросі
    1 выпадает такое RSS field rss_news_title error
    хотя все сделано правильно и никаких траблов не должно быть

    2 что делать если адрес сайта откуда грабаю newwws.ru а адрес картинки которая размещена sciens.newwws.ru Єто грабаетси нормально?

    3 Как біть со страницей для печати? я теряюсь
    есть такое
    страница
    http://test.ru/?ID=617860
    страиница для печати
    http://test.ru/?ID=617860&4Print=1

    что на что менять?

    и такое
    страница новости
    http://www.test2.net/main/1234567
    страница для печати
    http://www.test2.net/main/print/1234567

    Что вставлять в данніх страниці для печати?
     
  7. omihaz

    omihaz Постоялец

    Регистр.:
    12 сен 2006
    Сообщения:
    146
    Симпатии:
    24
    За доки спасибо. А есть готовые решения каких то известных сайтов, а не только лент рсс новостных движков типа СNN?
     
  8. mikhael-sm

    mikhael-sm Создатель

    Регистр.:
    9 сен 2006
    Сообщения:
    11
    Симпатии:
    2
    Для ленты.ру
    http://img.lenta.ru/r/EX/import.rss
    Страница для печати lenta.ru -> pda.lenta.ru
    Шаблон текста новости:
    {skip}
    </h3></center>
    {get}
    <!-- publications, urls -->
    {skip}
    <remove><center>{skip}</center></remove>

    Единственная проблема с этим сайтом, недоработка Newsgrabber
    Например на ленте все фото к статьям имеют имя PICTURE.JPG, соответственно габер сохраняет только первую, а остальные выбрасывает.
    Как сделать, чтобы он переименовывал изображения не знаю... если кто сталкивался - подскажите.
     
  9. wwwish

    wwwish Писатель

    Регистр.:
    7 сен 2006
    Сообщения:
    0
    Симпатии:
    0
    С твоим шаблоном при обновлении ошибка высветилась...
     
  10. mikhael-sm

    mikhael-sm Создатель

    Регистр.:
    9 сен 2006
    Сообщения:
    11
    Симпатии:
    2
    Там HTML код изменили... начало теперь надо искать по другому :)
     
    gramilla нравится это.