Подскажите как написать парсер.

Статус
В этой теме нельзя размещать новые ответы.

allsu

Постоялец
Регистрация
29 Дек 2007
Сообщения
135
Реакции
5
Вот имеем Для просмотра ссылки Войди или Зарегистрируйся

необходимо выдрать картинки (для начала)

хотябы намекните с чего начать где почитать полезную инфу?
Буду очень признателен!
 
как вариант - качать готовые скрипты парсинга и изучать их. Скрипты есть на этом сайте в разделе сео скрипты
 
Например:
PHP:
<?
$data = file_get_contents('http://aesmscash.com/webmaster/feed/222');

preg_match_all('/<\/url><url>http:\/\/(.*?)</i', $data, $matches);

print_r($matches[1]);
?>
 
Алгоритм написания простого однопоточного парсера:
1) Анализ исходного материала
(определить точки входа и выхода для блоков кода, которые нужно парсить)
2) Составить шаблон в виде регулярного выражения, на основании которого будет сделана выборка
3) Получить массив вхождений
4) Вывести массив

Что нужно прочитать:
1) О регулярных выражениях
2) О функции PHP preg_match_all
 
rised, так сложно всё описали :). Надо просто скачать через CURL страницу, написать регулярное выражение для выдирания урлов. Вот и всё.
 
Например:
PHP:
<?
$data = file_get_contents('http://aesmscash.com/webmaster/feed/222');

preg_match_all('/<\/url><url>http:\/\/(.*?)</i', $data, $matches);

print_r($matches[1]);
?>

вот попробовал ваш способ
что то не то выдало:(


или так и должно быть?
 
Оно выдало массив с адресами фотографий, а ты что хотел?
 
Это ещё зачем? file_get_contents + preg_match_all решают проблему.
ну ну
только уже почти на всех нормальных проектах если не определился браузер то гуляй вася
через сокеты/курл надженей
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху