[Ищу] Несколько вопросов по проксям

Статус
В этой теме нельзя размещать новые ответы.

opa100pe

Создатель
Регистрация
13 Сен 2010
Сообщения
32
Реакции
0
Бабок на прокси нету, поэтому хочу наваять парсилку, чтобы парсила паблик прокси с обновляющегося листа (листов) и держала в текстовичке десяток другой актуальных. Я в теме прокси ваще не секу, поэтому не понимаю вот такой штуки:
Welcome to the CoDeeN HTTP CDN Service!
You are using CoDeeN content distribution network(CDN). CoDeeN is a pulling-based HTTP content distribution network(CDN) deployed on PlanetLab with the goal of improving the Web performance.
You see this page because you chose to use CoDeeN in some way. If you don't want to surf through CoDeeN, please undo whatever step you made to use CoDeeN. Please check your proxy setting at your browser, or uninstall any anonymizer software which uses CoDeeN. By the way, using Web anonymizer through CoDeeN will not work smoothly, and your access to CoDeeN get blocked at any time.
Finally, please do not attempt to abuse our system. For security reasons, we closely monitor all the activities through CoDeeN and log all the requests, and in case of abuse these may be used as evidence in police investigation.
Otherwise, CoDeeN is open to public use, so feel free to enjoy the service. You will be redirected to the page you have just requested in ten seconds.
Через раз, когда беру проксю вот отсюда - hidemyass.com/proxy-list получаю в браузере вот такую хрень как выше, когда пытаюсь перейти на страничку. Потом меня с нее редиректит на капчу, а потом уже куда надо. Мне такие прокси не нужны - у меня парсинговые скрипты пахать не будут =). Вопрос - как из списка проксей отобрать нормальные, без вот этой хрени. Как чекаются прокси программно?
И еще - среднее время жизни паблик прокси?
ps. А что нуллед через прокси не работает?
edit:
Так, по поводу чекинга походу вкурил. Я т0 думал там как то мудрено проверяется, а оказывается это означает тупо через прокси получить страничку. И если удалось - все ок, норм прокся. Ладно с этим разобрался. Еще вопрос: я догадываюсь, что для парсинга гугла анонимность не критична. Это так? И вообще где можно наебаться с анонимностью, а где она не важана?
 
CoDeeN:

Как раз для гугла анонмность и критична, если айпишник статический, то лучше не светить - забанит и даже поиск работать не будет.
 
По хостнейму ещё можно фильтровать.
Код:
"planetlab"
*pl-1*
*pl-2*
*pl1*
*pl2*
*pl3*
*pl4*
*plab*
*planet*
*planlab*
*plgmu*
*pli1*
*pli2* 
*pllab*
*plnode*
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху