Проблема с парсингом гестов на GlobalSquid SE Parser v1.8

Тема в разделе "Вопросы новичков", создана пользователем stavalex, 4 янв 2008.

Статус темы:
Закрыта.
  1. stavalex

    stavalex Постоялец

    Регистр.:
    28 дек 2007
    Сообщения:
    53
    Симпатии:
    2
    Вообщем вчера запустил на часа 2 эту прогу. Сразу скажу, что соединение у меня довольно медленное.(спутник+мобила). Так вот искал в гугле, яхе и мсн, на яхе сразу ошибку выдавала, после 10 минутработы. И вообще напарсил он мне какую-то фигню! Всего где-то 400 ссылок, но что-то этоне похоже на гостевухи! Работаю без прокси, может поэтому? Ниже выложу напарсенную базу, посмотрите плиз, что не так или может это я нетак что-то делаю. Вот пареметры с которыми ищу, может кто поправит что:
    inurl:”net add_url php”
    inurl:”net add_url asp”
    inurl:”net add_url htm”
    inurl:”net add_url html”
    inurl:”net addurl php”
    inurl:”net addurl asp”
    inurl:”net addurl htm”
    inurl:”net addurl html”
    inurl:”net ?act=add php”
    inurl:”net ?act=add asp”
    inurl:”net ?act=add htm”
    inurl:”net ?act=add html”
    inurl:”net add php”
    inurl:”net add asp”
    inurl:”net add htm”
    inurl:”net add html”
    inurl:”net links_ex php”
    inurl:”net links_ex asp”
    inurl:”net links_ex htm”
    inurl:”net links_ex html”
    inurl:”net add_site php”
    inurl:”net add_site asp”
    inurl:”net add_site htm”
    inurl:”net add_site html”
    inurl:”net add/1 php”
    inurl:”net add/1 asp”
    inurl:”net add/1 htm”
    inurl:”net add/1 html”
    inurl:”net add_link.php?cat=0”
    inurl:”net index.php?actions=add”
    inurl:”net add+site php”
    inurl:”net add+site asp”
    inurl:”net add+site htm”
    inurl:”net add+site html”
    inurl:”net ?cf=add-site php”
    inurl:”net ?cf=add-site asp”
    inurl:”net ?cf=add-site htm”
    inurl:”net ?cf=add-site html”
    inurl:”net addlink php”
    inurl:”net addlink asp”
    inurl:”net addlink htm”
    inurl:”net addlink html”
    inurl:”net index.php?adds=1”
    inurl:”net cs.php?action=add”
    inurl:”net submit php”
    inurl:”net submit asp”
    inurl:”net submit htm”
    inurl:”net submit html”
     

    Вложения:

    • baza.rar
      Размер файла:
      11,8 КБ
      Просмотров:
      19
  2. D}I{I/IXAD

    D}I{I/IXAD Постоялец

    Регистр.:
    9 окт 2007
    Сообщения:
    145
    Симпатии:
    17
    не совсем корректно составлены запросы
    попробуй так
    site:net inurl:addlink.php
    а вообще тут на форуме выкладывали базу запросов
     
    stavalex нравится это.
  3. bobboy7

    bobboy7 Постоялец

    Регистр.:
    29 авг 2007
    Сообщения:
    140
    Симпатии:
    52
    просто укажи запрос , примерно так:
    Код:
    addlink
    add_url
    addguest
    и попробуй еще раз.
     
    stavalex нравится это.
  4. stavalex

    stavalex Постоялец

    Регистр.:
    28 дек 2007
    Сообщения:
    53
    Симпатии:
    2
    Спасибо, щас опробую.
     
  5. splinter

    splinter Постоялец

    Регистр.:
    31 май 2007
    Сообщения:
    74
    Симпатии:
    23
    А когда последний раз обновлялась программа? Просто ты пишешь что в Яхе ошибка появилась аж черещ 10 минут, а когда я последний раз видел софтину Яха не парсилась вообще. Если щас есть результат с Яху, то проблема в прокси. Гугл и Яху без прокси парсить бессмысленно тем более запросами содержащими inurl - это раз. Если признаки которые ты написал так и заносились в парсер, то забудь про нормальную базу структура "*" в операторе обозначает точное соблюдение запроса, а в урлах никогда не бывает пробелов - это два. Когда я пишу "*" - это обозначает что "priznak.php=gostevay_knigko" находится в кавычках тк является точным выражением, а когда ты пишешь inurl:”net add_url php” это обозначает ересь в неправильных кавычках-ёлочках, к тому же грамматически не верно написанных - это три.
     
    stavalex нравится это.
  6. imfake

    imfake Постоялец

    Регистр.:
    3 янв 2007
    Сообщения:
    52
    Симпатии:
    7
    Насчет ковычек верно, а насчет inurl не говори чепухи, без разницы какой запрос вводить хоть inurl ,хоть preved_medved ,если поставить частоту запросов 1 раз каждые 5 секунд, то вполне прилично парсит, и не банится гуглом.
     
    stavalex нравится это.
  7. stavalex

    stavalex Постоялец

    Регистр.:
    28 дек 2007
    Сообщения:
    53
    Симпатии:
    2
    Без прокси все делал. Версию не обновлял, как скачал у вас, так и пользуюсь. Яху немного парсит, но потом ошибка. А так спасибо, приму к сведению.
     
  8. splinter

    splinter Постоялец

    Регистр.:
    31 май 2007
    Сообщения:
    74
    Симпатии:
    23
    Ой ли? У меня при ручном парсинге капчу суёт через какое то время а ты про автомат такие заявления... Уж Яха точно банит
    и очень быстро и ей совершенно насрать через сколько секунд главное что подряд. Всё вышесказанное проверено РУЧНЫМ парсингом и является истиной а не "чепухой". Таймаут побольше помогает с баном Гугла бороться на какое то время но заявление относительно "не банится Гуглом" весьма смелое.
     
  9. Aiweb333

    Aiweb333 Постоялец

    Заблокирован
    Регистр.:
    25 дек 2007
    Сообщения:
    70
    Симпатии:
    3
    забей на яху парсь с гугла
     
  10. stavalex

    stavalex Постоялец

    Регистр.:
    28 дек 2007
    Сообщения:
    53
    Симпатии:
    2
    Да ужедругие запросы есть, вроде нормально парсит.
     
Статус темы:
Закрыта.