Как сграбить nnm.ru

Тема в разделе "NewsGrabberJC", создана пользователем bigbrain, 18 фев 2008.

Статус темы:
Закрыта.
  1. bigbrain

    bigbrain

    Регистр.:
    5 окт 2006
    Сообщения:
    689
    Симпатии:
    84
    Думаю все регулярно посещают nnm.ru, там очень много доков и у каждого своя RSS лента.
    Настроить ее пока не выходит почему-то. DOMT висит, а magpie граббит ГЛАВНУЮ страницу :bh:
    У кого-нибудь получалось?
     
  2. mleck

    mleck Писатель

    Регистр.:
    20 сен 2007
    Сообщения:
    0
    Симпатии:
    0
    Там многие доки закрыты для не зарегистрированных пользователей, так что думаю заморачиваться с этим не стоит
     
  3. dumber

    dumber

    Регистр.:
    23 апр 2007
    Сообщения:
    272
    Симпатии:
    123
    Либо не понял вопроса либо проблема проста как яйца :)

    http://www.nnm.ru/29.03.2008/page-3
    вот структура ссылки перечня доков
    Заменяем дату, затем в цикле меняем странички, наткнулись на пустую - аут, сменили дату повторили. С этих страничек осуществляем поиск материалов
    типа -
    http://original-sound-track.nnm.ru/alan_silvestri_young_guns_ii_score_expanded_1990

    после получения определенного кол-ва материалов - запускаем каждую страничку и дерем контент. Усе :)

    Где трудности:nezn:
     
  4. bigbrain

    bigbrain

    Регистр.:
    5 окт 2006
    Сообщения:
    689
    Симпатии:
    84
    Такого нет вроде даже в Про версии, только работа с RSS лентой пока. Может ты топиком ошибся и пишешь нам про обычный NG (не для Joomla) ? :)
     
  5. dumber

    dumber

    Регистр.:
    23 апр 2007
    Сообщения:
    272
    Симпатии:
    123
    Хлопцы Я вам пишу про уникальный PHP на котором Джумла написана.
    В жизни есть правило - хочешь нестандартную функцию - пиши сам :D
     
  6. mollott

    mollott Создатель

    Регистр.:
    2 дек 2007
    Сообщения:
    29
    Симпатии:
    7
    Человек имеет ввиду что для подобного сайта - как и для любой большой базы которую можно спарсить по регулярным выражениям -проще будет использовать HTML парсер.

    Я с ним полностью согласен.
    Если не можете сами - наймите фрилансера.
    Нуждающимся предоставлю свои услуги задешево.
     
  7. VasyaMalevich

    VasyaMalevich Создатель

    Регистр.:
    5 июл 2007
    Сообщения:
    35
    Симпатии:
    0
    Сграбленый контент не бужет уникальным. Меньше PR и ВИЦ
     
  8. mehanic

    mehanic Писатель

    Регистр.:
    4 апр 2007
    Сообщения:
    1
    Симпатии:
    29
    Еще один умник с пятью постами. Держите меня семеро...
     
  9. E-body

    E-body

    Регистр.:
    6 сен 2007
    Сообщения:
    979
    Симпатии:
    315
    ... или получите бан яндекса. Мне так было тоько за постинго иморт rss ленты в форум ипб.
     
  10. mehanic

    mehanic Писатель

    Регистр.:
    4 апр 2007
    Сообщения:
    1
    Симпатии:
    29
    Яндекс серьезный серчер. Только включить голову еще никто не отменял. Вот как ни крути, а почему-то получается. Что я не так делаю?
     
Статус темы:
Закрыта.