Проблема с парсингом гестов на GlobalSquid SE Parser v1.8

Статус
В этой теме нельзя размещать новые ответы.

stavalex

Постоялец
Регистрация
28 Дек 2007
Сообщения
53
Реакции
2
Вообщем вчера запустил на часа 2 эту прогу. Сразу скажу, что соединение у меня довольно медленное.(спутник+мобила). Так вот искал в гугле, яхе и мсн, на яхе сразу ошибку выдавала, после 10 минутработы. И вообще напарсил он мне какую-то фигню! Всего где-то 400 ссылок, но что-то этоне похоже на гостевухи! Работаю без прокси, может поэтому? Ниже выложу напарсенную базу, посмотрите плиз, что не так или может это я нетак что-то делаю. Вот пареметры с которыми ищу, может кто поправит что:
inurl:”net add_url php”
inurl:”net add_url asp”
inurl:”net add_url htm”
inurl:”net add_url html”
inurl:”net addurl php”
inurl:”net addurl asp”
inurl:”net addurl htm”
inurl:”net addurl html”
inurl:”net ?act=add php”
inurl:”net ?act=add asp”
inurl:”net ?act=add htm”
inurl:”net ?act=add html”
inurl:”net add php”
inurl:”net add asp”
inurl:”net add htm”
inurl:”net add html”
inurl:”net links_ex php”
inurl:”net links_ex asp”
inurl:”net links_ex htm”
inurl:”net links_ex html”
inurl:”net add_site php”
inurl:”net add_site asp”
inurl:”net add_site htm”
inurl:”net add_site html”
inurl:”net add/1 php”
inurl:”net add/1 asp”
inurl:”net add/1 htm”
inurl:”net add/1 html”
inurl:”net add_link.php?cat=0”
inurl:”net index.php?actions=add”
inurl:”net add+site php”
inurl:”net add+site asp”
inurl:”net add+site htm”
inurl:”net add+site html”
inurl:”net ?cf=add-site php”
inurl:”net ?cf=add-site asp”
inurl:”net ?cf=add-site htm”
inurl:”net ?cf=add-site html”
inurl:”net addlink php”
inurl:”net addlink asp”
inurl:”net addlink htm”
inurl:”net addlink html”
inurl:”net index.php?adds=1”
inurl:”net cs.php?action=add”
inurl:”net submit php”
inurl:”net submit asp”
inurl:”net submit htm”
inurl:”net submit html”
 

Вложения

  • baza.rar
    11,8 KB · Просмотры: 19
просто укажи запрос , примерно так:
Код:
addlink
add_url
addguest
и попробуй еще раз.
 
Спасибо, щас опробую.
 
А когда последний раз обновлялась программа? Просто ты пишешь что в Яхе ошибка появилась аж черещ 10 минут, а когда я последний раз видел софтину Яха не парсилась вообще. Если щас есть результат с Яху, то проблема в прокси. Гугл и Яху без прокси парсить бессмысленно тем более запросами содержащими inurl - это раз. Если признаки которые ты написал так и заносились в парсер, то забудь про нормальную базу структура "*" в операторе обозначает точное соблюдение запроса, а в урлах никогда не бывает пробелов - это два. Когда я пишу "*" - это обозначает что "priznak.php=gostevay_knigko" находится в кавычках тк является точным выражением, а когда ты пишешь inurl:”net add_url php” это обозначает ересь в неправильных кавычках-ёлочках, к тому же грамматически не верно написанных - это три.
 
А когда последний раз обновлялась программа? Просто ты пишешь что в Яхе ошибка появилась аж черещ 10 минут, а когда я последний раз видел софтину Яха не парсилась вообще. Если щас есть результат с Яху, то проблема в прокси. Гугл и Яху без прокси парсить бессмысленно тем более запросами содержащими inurl - это раз. Если признаки которые ты написал так и заносились в парсер, то забудь про нормальную базу структура "*" в операторе обозначает точное соблюдение запроса, а в урлах никогда не бывает пробелов - это два. Когда я пишу "*" - это обозначает что "priznak.php=gostevay_knigko" находится в кавычках тк является точным выражением, а когда ты пишешь inurl:”net add_url php” это обозначает ересь в неправильных кавычках-ёлочках, к тому же грамматически не верно написанных - это три.
Насчет ковычек верно, а насчет inurl не говори чепухи, без разницы какой запрос вводить хоть inurl ,хоть preved_medved ,если поставить частоту запросов 1 раз каждые 5 секунд, то вполне прилично парсит, и не банится гуглом.
 
Без прокси все делал. Версию не обновлял, как скачал у вас, так и пользуюсь. Яху немного парсит, но потом ошибка. А так спасибо, приму к сведению.
 
Насчет ковычек верно, а насчет inurl не говори чепухи, без разницы какой запрос вводить хоть inurl ,хоть preved_medved ,если поставить частоту запросов 1 раз каждые 5 секунд, то вполне прилично парсит, и не банится гуглом.
Ой ли? У меня при ручном парсинге капчу суёт через какое то время а ты про автомат такие заявления... Уж Яха точно банит
и очень быстро и ей совершенно насрать через сколько секунд главное что подряд. Всё вышесказанное проверено РУЧНЫМ парсингом и является истиной а не "чепухой". Таймаут побольше помогает с баном Гугла бороться на какое то время но заявление относительно "не банится Гуглом" весьма смелое.
 
  • Заблокирован
  • #9
забей на яху парсь с гугла
 
Да ужедругие запросы есть, вроде нормально парсит.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху