Грабинг БД по моделям ТС

Тема в разделе "PHP", создана пользователем ShippKZ, 1 ноя 2008.

Статус темы:
Закрыта.
Модераторы: latteo
  1. ShippKZ

    ShippKZ Создатель

    Регистр.:
    17 сен 2008
    Сообщения:
    33
    Симпатии:
    7
    Ктонить напишите скрипт от <?php до ?> или дайте подробный алгоритм действий используя такую наводку ;)
    Делается это примерно так

    $html = file_get_contents("http://бибика.ру"); // парсим сайт


    preg_match_all('/left[\'"]><a\s+href=[\'"][\/]auto[\/](.*?)\/[\'"]/', $html, $result);

    // прегматч вытаскивает все что заключено между определенными тегами
    // почитайте мануалы как писать регулярные выражения.
    // в результате получили ссылки на страницы. (ваша задача это марка-множество моделей.), теперь эти ссылки открывает по циклу.

    for ($i=0; $i<count($result[0]); $i++)



    {
    echo "<br>";
    echo $result[1][$i]."<br />\n";
    $html = file_get_contents("http://сайт.ру/auto/".$result[1][$i]);
    preg_match_all('/Телефон:(.*?)<br\/>/', $html, $rlt); // тут вытаскиваю с этих страниц телефон

    echo $rlt[1][0]; // вывожу результат.

    ps "наводка" не моя, я в PHP ноль, но БД по всем моделям ТС с данного сайта ну очень нужна!:bc:
     
  2. everest

    everest

    Регистр.:
    20 дек 2006
    Сообщения:
    197
    Симпатии:
    20
    ну для того чтобы регулярные выражения писать - нужно сам сайт видеть, с которого будет инфа выдираться и что именно выдирать (и откуда, т.е. с какого именно места).

    т.к. на сайте нужная инфа может встречаться несколько раз - в титле, кейвордах, заголовках и еще где-то, но полностью только в определенном месте...
     
  3. ewg777

    ewg777

    Регистр.:
    6 авг 2007
    Сообщения:
    763
    Симпатии:
    321
    Скинь в ЛС адрес сайта, что именно парсить. ;)
     
Статус темы:
Закрыта.