Найти все ссылки на странице

Статус
В этой теме нельзя размещать новые ответы.

uNknownMark

Постоялец
Регистрация
22 Сен 2007
Сообщения
393
Реакции
170
Добрый день всем. Подскажите, пожалуйста, регулярные выражения для некоторых вещей.
Загрузили страницу с помощью CURL и надо найти все ссылки на странице и сохранить их в массив где ключ это номер ссылки по порядку (с верха до низа если идти), а значение это двухмерный массив в котором первое значение это куда ссылка ссылается, то есть значение href, а второе значение это сам анкор (то что расположено между тегами <a></a>).
Всем заранее спасибо за помощь.
P.S.
И подскажите пожалуйста регулярку которая могла бы проверить есть ли у ссылки свойство rel="nofollow"
 
PHP:
preg_match_all('~<a\\s([^>]*?)\\bhref\\s*=\\s*(["\'])(.*?)\\2([^>]*?)>(.*?)</a>~s', $html, $m, PREG_SET_ORDER);
foreach($m as $k=>$v)
	printf('%d) %s => %s, nofollow = %s<br />', $k, htmlspecialchars($v[5]), htmlspecialchars($v[3]), preg_match('~\\brel\\s*=\\s*(["\'])nofollow\\1~', $v[1].$v[4])? 'y':'n');
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху