[Ищу] Парсер w3c

Статус
В этой теме нельзя размещать новые ответы.

01ssv

Постоялец
Регистрация
29 Янв 2008
Сообщения
63
Реакции
5
Такой скрипт чтобы отдавал для заданной страницы (URL) валидность и число ошибок по W3C
 
Какой еще file_get_contents?
там страницу надо отправлять на валидацию, а это либо снупи либо курл, а возиться времени нет хочется что то готовое взять
 
PHP:
<?PHP  
	function parse_w3 ($url)
	{

	  $fp = fsockopen('validator.w3.org', 80, $errno, $errstr, 30);
	  if (!$fp) echo "Ошибка соединения, code error $errstr ($errno)<br />\n";
	  else
	  {
		$headers = "GET /check?uri=$url&charset=%28detect+automatically%29&doctype=Inline&group=0 HTTP/1.0\r\n";
		$headers.= "Host: validator.w3.org\r\n";
	    $headers .= "Connection: Keep-Alive\r\n\r\n";
	    fwrite($fp, $headers);
	    
	    for ($i=0; $i<101; $i++) 
	    {$line .= fgets($fp, 1024);} 
	    fclose($fp);  
	  }
	  
	preg_match("#<h2.*>(.*)</h2>.*<td colspan=\"2\".*>(.*)<!-- this case where#smi",$line,$pars);
	$out['0']=$pars[1];
	$out['1']=$pars[2];
		
		return ($out);
	}

$url='http://google.ru/';
print_r(parse_w3($url));
?>

preg_match сам поправиш... писал на отшебись.
На file_get_contents написать можно ! НО ЭТО не целесобразно !!! Пока он скачает эту страницу может столько времени пройти....
А на сокетах я читаю только первые 100 строк.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху