Грабинг БД по моделям ТС

Статус
В этой теме нельзя размещать новые ответы.

ShippKZ

Создатель
Регистрация
17 Сен 2008
Сообщения
33
Реакции
7
Ктонить напишите скрипт от <?php до ?> или дайте подробный алгоритм действий используя такую наводку ;)
Делается это примерно так

$html = file_get_contents("http://бибика.ру"); // парсим сайт


preg_match_all('/left[\'"]><a\s+href=[\'"][\/]auto[\/](.*?)\/[\'"]/', $html, $result);

// прегматч вытаскивает все что заключено между определенными тегами
// почитайте мануалы как писать регулярные выражения.
// в результате получили ссылки на страницы. (ваша задача это марка-множество моделей.), теперь эти ссылки открывает по циклу.

for ($i=0; $i<count($result[0]); $i++)



{
echo "<br>";
echo $result[1][$i]."<br />\n";
$html = file_get_contents("http://сайт.ру/auto/".$result[1][$i]);
preg_match_all('/Телефон:(.*?)<br\/>/', $html, $rlt); // тут вытаскиваю с этих страниц телефон

echo $rlt[1][0]; // вывожу результат.

ps "наводка" не моя, я в PHP ноль, но БД по всем моделям ТС с данного сайта ну очень нужна!:bc:
 
ну для того чтобы регулярные выражения писать - нужно сам сайт видеть, с которого будет инфа выдираться и что именно выдирать (и откуда, т.е. с какого именно места).

т.к. на сайте нужная инфа может встречаться несколько раз - в титле, кейвордах, заголовках и еще где-то, но полностью только в определенном месте...
 
Скинь в ЛС адрес сайта, что именно парсить. ;)
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху