Составить регулярное выражение

Статус
В этой теме нельзя размещать новые ответы.
Можно код кодовый с сокетами этими? А то я в этом не очень...
 
Не важно на чем делать, важно сменить User Agent. Что бы сервер по нему не узнал, что мы какая-нибудь библиотека для парсинга.
Пример на Perl, LWP
Код:
#!/usr/bin/perl

use LWP;

$browser = LWP::UserAgent->new;
 #В следующей строке устанавливается User Agent. Можно написать что угодно, лучше UA реально существующего бразера. В данном случае прикинемся Оперой.
$browser->agent('Opera/9.64 (Windows NT 5.1; U; ru) Presto/2.1.1');
$url = 'http://www.kinopoisk.ru';
$response = $browser->get($url);
print $response->content;
 
самый лучший способ выдрать какие либо теги это просто использовать ДОМ:
PHP:
$document = file_get_contents('http://google.com/');

/*$document = str_replace('<head>','<head>
<meta http-equiv="Content-type" content="text/html;charset=utf-8" />',$document); */ // на всякий случай если хед не содержит указания какая кодировка используется
	$doc = new DOMDocument();
	if(!@$doc->loadHTML($document))
		throw new Exception("loadHtml");
	$xpath = new DOMXPath($doc);
	$entries = $xpath->query('//img', $doc);
	foreach ($entries as $entry) {
	    print $entry->attributes->getNamedItem('src')->textContent;
            print "\n";
	}

Добавлено через 4 минуты
куки можно использовать так:
PHP:
               $curl_handle = curl_init();
		
		curl_setopt($curl_handle,CURLOPT_RETURNTRANSFER,1);
		curl_setopt($curl_handle,CURLOPT_USERAGENT,'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)');
		 
		curl_setopt($curl_handle,CURLOPT_CONNECTTIMEOUT,35);
		curl_setopt($curl_handle,CURLOPT_TIMEOUT,50);
		curl_setopt($curl_handle,CURLOPT_FOLLOWLOCATION,1); 

                $cookie_file = "/tmp/cookies/".$file;
		if(!is_file($cookie_file)){
			$fd = fopen($cookie_file,"w");
			if(!$fd) throw new Exception("can not create cookie file");
			fclose($fd);
		}
		curl_setopt($curl_handle,CURLOPT_COOKIEFILE,$cookie_file);
		curl_setopt($curl_handle,CURLOPT_COOKIEJAR,$cookie_file);

теперь куки будут храниться между вызовами скрипта в файле только надо создать папочку /tmp/cookies
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху