Как сделать паук для анализа внеших ссылок?

Тема в разделе "Как сделать...", создана пользователем dmsoh, 16 мар 2010.

Статус темы:
Закрыта.
  1. dmsoh

    dmsoh

    Регистр.:
    27 янв 2007
    Сообщения:
    192
    Симпатии:
    42
    Я хочу сделать простейший скрипт, который бы обходил сайт и сохранял файл со всеми внешними ссылками (т.е. ссылками не принадлежащие данному домену), набросайте пожалуйста, как примерно это делается.
     
  2. Jed7777

    Jed7777 Постоялец

    Регистр.:
    17 июл 2008
    Сообщения:
    136
    Симпатии:
    120
    Если я правильно понял, то:

    1. Грузим сайт с помощью CURL.
    2. С помощью preg_match вытягиваем ссылки.
    3. Сохраняем с помощью file_put_contents в файл.
     
Статус темы:
Закрыта.