проблема с парсингом(

Тема в разделе "PHP", создана пользователем boctorg, 13 июл 2008.

Статус темы:
Закрыта.
Модераторы: latteo
  1. boctorg

    boctorg Прохожие

    проблема с парсингом( http://www.audiovkontakte.ru

    раньше парсил и все ок, а ща не хочет

    парсил file_get_contents
     
  2. bork1234

    bork1234 Постоялец

    Регистр.:
    25 июн 2008
    Сообщения:
    65
    Симпатии:
    13
    Включаю телепатию.

    http://ru2.php.net/manual/ru/function.file-get-contents.php

     
  3. boctorg

    boctorg Прохожие

    не понял ответа , кстати на денвере все работает :) , а на хостинге нет :( не могли сайт защиту какую нить поставить ?
     
  4. bork1234

    bork1234 Постоялец

    Регистр.:
    25 июн 2008
    Сообщения:
    65
    Симпатии:
    13
    Поскольку Вы не объяснили что именно не работает, то я предположил, что функция file_get_contents() не работает с получением контента по ссылкам. Для того чтобы эта функция работала с URL необходимо включение соответствующей опции. Детально можете посмотреть в мануале по ссылке выше. Там же в комментариях Вы можете посмотреть код-аналог с реализацией на CURL (если он включен у вашего хостинг-провайдера)
     
  5. boctorg

    boctorg Прохожие

    и через курл( результат тотже на денвере все ок , на хостинге не работает( причем только с этим сайтом, с любым другим все впорядке , прошу проверить на своем хостинге , если он имеется .спс
     
  6. bork1234

    bork1234 Постоялец

    Регистр.:
    25 июн 2008
    Сообщения:
    65
    Симпатии:
    13
    Вы правы. На моем хостинге тоже не заработало, причину не понял - разбираться было лень. Выкладываю функцию, с которой забрать контент у меня получилось (забираю через поток).


    Посмотреть вложение get_on_80.txt
     
  7. gregzem

    gregzem

    Регистр.:
    21 окт 2007
    Сообщения:
    200
    Симпатии:
    63
    Возможные причины:

    1. забаненный IP хостера со стороны сайта, с которого грабите
    2. запрещены внешние коннекты с хостинга
    3. Кривой роутинг (например, жил был сайт на хостинге A, на нем же держались зоны, затем сайт переехал на хостинг Б, зоны держатся на хостинге Б, но на хостинге А не удалили из DNS сервера записи о домене. Так получилось, например, что вы на том же хостинге А. Роутинг в этом случае идет в рамках подсети хостинга А, но сайта там уже нет, будет ошибка).

    да много чего еще. Вы бы лучше уточнили, в чем ошибка? Отваливается по таймауту, DNS Error, Forbidden или что?
     
  8. bork1234

    bork1234 Постоялец

    Регистр.:
    25 июн 2008
    Сообщения:
    65
    Симпатии:
    13
    1. Это точно не так
    2. Может быть, не проверял, но через поток сработало
    3. Точно нет
    4. Вот что выдает мне
    PHP:
    <? die(file_get_contents('http://www.audiovkontakte.ru/')); ?>
    Код:
    Forbidden
    You don't have permission to access / on this server.
    Additionally, a 500 Internal Server Error error was encountered while trying to use an ErrorDocument to handle the request.
    
     
  9. ozware

    ozware

    Регистр.:
    22 апр 2007
    Сообщения:
    327
    Симпатии:
    42
    забанили IP :)
    попробуйте с другого хостинга
     
  10. bork1234

    bork1234 Постоялец

    Регистр.:
    25 июн 2008
    Сообщения:
    65
    Симпатии:
    13
    Ага. Я заходил со своего хостинга и меня забанили по IP с первого же запроса. Если это было бы так, то получение страницы через stream тоже бы не прошло.
     
Статус темы:
Закрыта.