Ищу парсер G+Y

Тема в разделе "Софт", создана пользователем DuvE, 21 авг 2010.

Статус темы:
Закрыта.
  1. DuvE

    DuvE

    Регистр.:
    16 май 2010
    Сообщения:
    510
    Симпатии:
    10
    Собственно перепробовал разные Aura, AGGRES и т.д. Пока ни один не подошёл, первый под винду не работает, второй не парсит почти. Желательно Hrefer 2.9 нулёный или любой другой.
     
  2. sw04

    sw04 seoplayer

    Регистр.:
    1 дек 2007
    Сообщения:
    601
    Симпатии:
    193

    по ТЗ могу сделать бесплатно. =)
     
  3. DuvE

    DuvE

    Регистр.:
    16 май 2010
    Сообщения:
    510
    Симпатии:
    10
    Ну, желательно простой парсер ссылок по словам и признакам. Как я говорил главное Я и Г. Функции как у AGGRES и т.д.
     
  4. sw04

    sw04 seoplayer

    Регистр.:
    1 дек 2007
    Сообщения:
    601
    Симпатии:
    193

    парсить только ру ПС?
    куда выводить результаты?
    выводить только главные страницы или внутренние тоже?

    без ТЗ не обойтись. но я сделаю со всеми настройками :)
    поддержка прокси наверника тоже нужна
     
  5. Google.com

    Google.com Читатель

    Заблокирован
    Регистр.:
    16 фев 2010
    Сообщения:
    250
    Симпатии:
    295
    Неправда, Агресс очень даже хорошо парсит...Главное ставить задержку секунд 15 и не юзать в запросах "inurl", а парсить по признакам в тексте.
    Самопис ничем не будет отличаться...
    Вот мои настрйки "search"
    en
    Url-http://www.google.com
    AbsoluteUrl-http://www.google.com/search?num=100&hl=en&client=opera&rls=ru&q={REQUEST}&aq=f&lr=lang_en&aqi=g10&aql=&oq=&gs_rfai=
    UntilTextAfter-<li class=g><h3 class=r><a href="{TEXT}"
    UntilNextLinkAfter-</a><td class=b><a href="{NEXTLINK}">
    Pattern-{TEXT}

    ru
    Url-http://www.google.com
    AbsoluteUrl-http://www.google.com/search?num=100&hl=ru&client=opera&rls=ru&q={REQUEST}&aq=f&lr=lang_ru&aqi=g10&aql=&oq=&gs_rfai=
    UntilTextAfter-<li class=g><h3 class=r><a href="{TEXT}"
    UntilNextLinkAfter-</a><td class=b><a href="{NEXTLINK}">
    Pattern-{TEXT}
     
  6. DuvE

    DuvE

    Регистр.:
    16 май 2010
    Сообщения:
    510
    Симпатии:
    10
    В смысле не использовать "inurl", как тогда другими способами парсить по признакам?
     
  7. Google.com

    Google.com Читатель

    Заблокирован
    Регистр.:
    16 фев 2010
    Сообщения:
    250
    Симпатии:
    295
    По тексту на странице. Ищешь текст который характерен только для нужного тебе движка.
    Ну или юзай прокси. Агресс парсер поддерживает прокси
     
  8. Klepach

    Klepach

    Регистр.:
    31 окт 2008
    Сообщения:
    942
    Симпатии:
    250
    Ну и какие результаты по колличеству без inurl чем с ним???
     
  9. Google.com

    Google.com Читатель

    Заблокирован
    Регистр.:
    16 фев 2010
    Сообщения:
    250
    Симпатии:
    295
    Ну если не юзать прокси, то даже 20-ти секундная задержка не помогает при использовании inurl.
    Если же не использовать, то у меня парсинг идёт до конца, пока запросы не закончатся.
     
  10. Adamoff

    Adamoff Создатель

    Регистр.:
    10 июл 2010
    Сообщения:
    14
    Симпатии:
    0
    Ребят, а есть толковые обзоры парсеров ?! А то по описанию все мощные и гибкие...
     
Статус темы:
Закрыта.