Как напарсить базу блогов

Тема в разделе "Тех. вопросы", создана пользователем betalik, 17 апр 2009.

  1. betalik

    betalik

    Регистр.:
    22 июл 2008
    Сообщения:
    159
    Симпатии:
    5
    ребята подскажите как напарсить базу блогов
     
  2. OnArs

    OnArs

    Регистр.:
    30 авг 2008
    Сообщения:
    259
    Симпатии:
    74
    Добавить с SE, а там нечто проде:
    site:.ru inurl:"/2009/" intext:"Я не робот"

    Но это лишь один из сотни вариантов :ay:
     
    betalik нравится это.
  3. betalik

    betalik

    Регистр.:
    22 июл 2008
    Сообщения:
    159
    Симпатии:
    5
    ничего не понял
     
  4. xaver

    xaver Постоялец

    Регистр.:
    3 май 2008
    Сообщения:
    123
    Симпатии:
    30
    введи это в гугле и отпарсь выдачу
     
    betalik нравится это.
  5. EugeneVC

    EugeneVC

    Регистр.:
    28 окт 2007
    Сообщения:
    297
    Симпатии:
    83


    Для того, что бы напарсить базу блогов нада:

    1) Софт, которые позволяет собирать с выдачи поисковика. Обычно советуют агресс парсер. Можно так же использовать скрипты
    2) Далее идем в гугл и вводим фразу в ковычках "Немного не в тему, но вопрос такой возник автору." - видим 300 сайтов с этой фразой. Почти все блоги - собираем эту выдачу скриптом
    3) составляем 100-200 топовых фраз спамеров типа "Афтор, пиши еще" и действуем по способу 2.
    4) На тех блогах которые вы посетили есть куча комментов с линками на сайты - можно собрать беки по яху.
    5) Можно отпарсить список блогов на яндексе - их там 6 милионов, я выкладывал эту базу на нуледе.

    PS: как то так. агрессом я не пользуюсь. пишу свои скрипты

     
    and77st и betalik нравится это.
  6. MoQz

    MoQz Постоялец

    Регистр.:
    7 апр 2009
    Сообщения:
    73
    Симпатии:
    95
    Используй AGGRESS Parser
    В нем и набивай указанные запросы, либо используй от рассылка комментариев:
    “Спасибо. Классный Пост.”
    “Да я согласен, но можно выбрать другой вариант.”
    “А еще можно полазить по форумам, там выкладывают базы”
    и т.д.::) http://vector-seo.info/?p=5
     
  7. smithws

    smithws

    Регистр.:
    19 июн 2008
    Сообщения:
    481
    Симпатии:
    153
    На этот крючок попались какие то МЕГА блоги, типа livesport.ru
    Не лучше ли пойти проторенным путем и набрать вот такsite:.ru inurl:"blog" intext:"Я не робот":(
     
  8. kactetus

    kactetus митя is here )

    Регистр.:
    26 авг 2007
    Сообщения:
    441
    Симпатии:
    278
    Вот небольшая подблрочка от меня

    ENGLISH
    Leave a Reply" +Name +Mail +Website +wordpress -logged -noindex
    "XML-RPC server accepts POST requests only" -"порно" -"Comments Off" -"спам"
    "Leave a Reply" +Name +Mail +Website +wordpress -logged -noindex

    Russian
    +WordPress "Оставьте свой комментарий"-зарегистрироваться -должны
    +WordPress "Оставить комментарий" -зарегистрироваться -должны
    +Имя (обязательно) +Email (обязательно) +Сайт +wordpress -зарегистрироваться -должны
    +Имя +Email +Сайт +wordpress -noindex -nofollow -спамеры
    "XML-RPC server accepts POST requests only" -"порно" -"Comments Off" -"спам"
     
    CNiks0N, vbnm070 и betatest нравится это.
  9. sanya32

    sanya32 Постоялец

    Регистр.:
    19 авг 2008
    Сообщения:
    55
    Симпатии:
    11
    Есть проги, например сеомонитор. Очень упрощают задачу.
     
  10. GANGSTArbiter

    GANGSTArbiter Постоялец

    Регистр.:
    20 мар 2009
    Сообщения:
    76
    Симпатии:
    25
    Без хайдов - таким образом найжет 90% блогов на нужной платформе:
    В гугле: Powered by WordPress"

    Слово Wordpress можно заменить на любое другое название нужного движка :)