[Помогите] не грабит FeedMAster

Тема в разделе "Wordpress", создана пользователем Sanyh, 27 май 2008.

Статус темы:
Закрыта.
Модераторы: Sorcus
  1. Sanyh

    Sanyh

    Регистр.:
    20 сен 2006
    Сообщения:
    280
    Симпатии:
    13
    не грабит FeedMAster

    задаю ленту

    1.
    RSS or Atom URL: http://mobiles-news.ru/rss.xml
    Static page pattern: <span class="ntitle">{get}</span>
    Get content: <span class="news">{get}</span>

    выдает только это:
    Reading - catId: 0; source: http://mobiles-news.ru/


    2. вторая лента
    RSS or Atom URL: http://www.magama.ru/rss.xml
    Static page pattern: <h1>{get}</h1>
    Get content: <div class="news">{get}</div></div>

    Выдает
    Reading - catId: 0; source: http://www.magama.ru/rss.xml
    Array
    (
    )
     
  2. sw04

    sw04 seoplayer

    Регистр.:
    1 дек 2007
    Сообщения:
    601
    Симпатии:
    193
    нафига задаешь Static page pattern?
    это надо только если ты парсишь статические страницы. без rss.
    get content правильно стоит.
    ps перенёс в соотвествующий раздел.
     
  3. Sanyh

    Sanyh

    Регистр.:
    20 сен 2006
    Сообщения:
    280
    Симпатии:
    13

    так если не задаю Static page pattern тоже самое:
    Get content тот же самый

    Reading - catId: 0; source: http://www.magama.ru/rss.xml
    Array
    (
    )




    Reading - catId: 0; source: http://mobiles-news.ru/
    Array
    (
    )
     
  4. sw04

    sw04 seoplayer

    Регистр.:
    1 дек 2007
    Сообщения:
    601
    Симпатии:
    193
    БЕЗ Static page pattern парсит замечательно.
    C Static page pattern НЕ парсит. испытал.
    Попробуй поставить ограничение на количество постов в день и постить в какую-либо существующую категорию.

    версия wordpress?

    ps попробуй сменить хостера.
     
  5. Sanyh

    Sanyh

    Регистр.:
    20 сен 2006
    Сообщения:
    280
    Симпатии:
    13
    я запускаю в ручную http://domen.com/wp-feedmaster.php
    версия WP 2.3.3

    а что с хостером может быть не так

    Добавлено через 4 минуты
    задал конкретную котегорию и поставил ограничение на кол. постов сработало
    токо вот он с грабил не весь текст а часть в конце "..."

    страничка откуда статья
    http://mnovosti.ru/devices/news/19649.html

     
  6. kriemm

    kriemm Постоялец

    Регистр.:
    5 дек 2006
    Сообщения:
    78
    Симпатии:
    32
    FeedMAster – 90% наработанных рсс, которые я постоянно использую для сателлитов, вообще отказался грабить. Так что я выдрал из него тока синономайзер. Сам скрипт пылится на полке.

    По теме, попробуй сначала сграбить рсс используя тока функцию - Parse only RSS feed,

    если нормально работает значит 99% что сграбить полную статью получится без проблем. Главное грамотно подобрать патерн для страницы.
    Например, для этой страницы:

    _http://mnovosti.ru/devices/news/19649.html

    подойдет такой патерн:

    <div class="subhead">{get}<p class="headrest">
     
  7. Sanyh

    Sanyh

    Регистр.:
    20 сен 2006
    Сообщения:
    280
    Симпатии:
    13

    <p class="headrest"> - такой записи вообще не нашел на странице

    и вообще какой лучше граббер тогда использовать для WP ?
     
  8. Sanyh

    Sanyh

    Регистр.:
    20 сен 2006
    Сообщения:
    280
    Симпатии:
    13
    где глюк, я ишю поиском на старинце headrest - нету!
    ВОТ КУСОК:
    http://mnovosti.ru/devices/news/19649.html

     
  9. kriemm

    kriemm Постоялец

    Регистр.:
    5 дек 2006
    Сообщения:
    78
    Симпатии:
    32
    Ну может я на другой странице смотрел код, это не важно.
    Конкретно для этой рсс:

    http://mnovosti.ru/devices/news/rss/type/news/
    (и этой странице соответственно - http://mnovosti.ru/devices/news/19649.html

    Должен работать такой паттерн:

    <div class="subhead">{get}<div class="close">

    На счет какая грабилка лучше, если не кодер придется пользоваться готовыми решениями.
    Тот же FeedMAster грабит, не все, но подобрать рсс под него можно. Лично я использую ньюсграбер, переписанный под свои нужды...
     
  10. Kolombo

    Kolombo Постоялец

    Регистр.:
    5 фев 2008
    Сообщения:
    64
    Симпатии:
    4
    А в чем может быть проблема, что при граббинге ссылок, они не отображаются! Граббинг идет с РСС, там есть теги ссылок, но при граббинге в результате ссылок нет! Есть только надписи, но самомго линка нет
     
Статус темы:
Закрыта.