помогите плиз удалить в тхт все символы после слеша

extrimportal

Я за мир, во всём мире!
Заблокирован
Регистрация
28 Ноя 2008
Сообщения
590
Реакции
120
  • Автор темы
  • Заблокирован
  • #1
помогите плиз, есть текстовик. нужно удалить всё после третьего слеша /
п.с. парсеная база сайтов
в формате _http://sdfsg/beleberda, нужно взять только адреса.
 
PHP:
^(http:\/\/)?([^\/]+)
 
  • Автор темы
  • Заблокирован
  • #3
а можно начиная с <?php :nezn:
 
PHP:
<?php
$txt = '';
$site_arr = file('file.txt');
foreach($site_arr as $site){
   $txt .= preg_replace('~(http://.*?/).*~', '$1', $site)."\n";
}
echo $txt;
?>
 
PHP:
<?
preg_match("/^(http:\/\/)?([^\/]+)/i", "http://www.nulled-mirror.com/newreply.php", $matches);
echo $matches[0];
?>

выведет
 
Как не озвученный вариант без регулярок ;)

PHP:
<?php
$f = file('ПУТЬ_ДО_ФАЙЛА');
$cF = sizeof($f);
for ($i=0; $i<$cF; $i++) {
	$t = parse_url($f[$i]);
	$r = $r.$t['host']."\r\n";
}

echo $r; 
?>
 
$urlArr = parse_url( $url );
Возвращает
Правильно. Но затем берётся только хост. в принципе, покрасивее было бы
parse_url($f[$i], PHP_URL_HOST);

2trooll
А вдруг в процессе парсинга будет сайт с портом?) лучше уж регуляркой чем писать ещё строчку кода :D
 
Назад
Сверху