Помогите спарсить новости

Статус
В этой теме нельзя размещать новые ответы.

LPKIR

Постоялец
Регистрация
8 Апр 2008
Сообщения
62
Реакции
24
Нужно выкрасть текст новостей с сайта , убирая все html теги и заменяя кавычки на \" только в тексте новости
 
для начала
PHP:
if (preg_match('/<h1>Новости<\/h1>[^<]*<!--blockstart-->(?P<news_block>.*?)<!--blockend-->/si', $news, $result)) {
	result = $result['news_block'];
} else {
	result = "";
}

далее

PHP:
preg_match_all('/<div class="tz_top_rep_content_block_main">(?P<news_title>[^<]*)<\/div>.*?<div class="date_block">.*?<span>(?P<news_datetime>[^<]*)<\/span>\r\n.*?<div class="tz_content_block_main">(?P<news_text>.*?)<\/div>/si', $result, $result, PREG_SET_ORDER);
print('<pre>');
foreach($result as $i => $part){
  print_r($result[$i]);
}

выдрать html тэги и заменить кавычки на \" думаю сам сможешь ;) (hint: strip_tags и str_replace помогут)
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху