проблема с парсингом(

Статус
В этой теме нельзя размещать новые ответы.
B

boctorg

Прохожие
проблема с парсингом(

раньше парсил и все ок, а ща не хочет

парсил file_get_contents
 
Включаю телепатию.

Для просмотра ссылки Войди или Зарегистрируйся

Для этой функции вы можете использовать URL в качестве имени файла, если была включена опция "fopen wrappers". Смотрите более подробную информацию об определении имени файла в описании функции fopen(), а также список поддерживаемых протоколов URL в List of Supported Protocols/Wrappers.
 
не понял ответа , кстати на денвере все работает :) , а на хостинге нет :( не могли сайт защиту какую нить поставить ?

Поскольку Вы не объяснили что именно не работает, то я предположил, что функция file_get_contents() не работает с получением контента по ссылкам. Для того чтобы эта функция работала с URL необходимо включение соответствующей опции. Детально можете посмотреть в мануале по ссылке выше. Там же в комментариях Вы можете посмотреть код-аналог с реализацией на CURL (если он включен у вашего хостинг-провайдера)
 
и через курл( результат тотже на денвере все ок , на хостинге не работает( причем только с этим сайтом, с любым другим все впорядке , прошу проверить на своем хостинге , если он имеется .спс
 
и через курл( результат тотже на денвере все ок , на хостинге не работает( причем только с этим сайтом, с любым другим все впорядке , прошу проверить на своем хостинге , если он имеется .спс

Вы правы. На моем хостинге тоже не заработало, причину не понял - разбираться было лень. Выкладываю функцию, с которой забрать контент у меня получилось (забираю через поток).

 
и через курл( результат тотже на денвере все ок , на хостинге не работает( причем только с этим сайтом, с любым другим все впорядке , прошу проверить на своем хостинге , если он имеется .спс

Возможные причины:

1. забаненный IP хостера со стороны сайта, с которого грабите
2. запрещены внешние коннекты с хостинга
3. Кривой роутинг (например, жил был сайт на хостинге A, на нем же держались зоны, затем сайт переехал на хостинг Б, зоны держатся на хостинге Б, но на хостинге А не удалили из DNS сервера записи о домене. Так получилось, например, что вы на том же хостинге А. Роутинг в этом случае идет в рамках подсети хостинга А, но сайта там уже нет, будет ошибка).

да много чего еще. Вы бы лучше уточнили, в чем ошибка? Отваливается по таймауту, DNS Error, Forbidden или что?
 
Возможные причины:

1. забаненный IP хостера со стороны сайта, с которого грабите
2. запрещены внешние коннекты с хостинга
3. Кривой роутинг (например, жил был сайт на хостинге A, на нем же держались зоны, затем сайт переехал на хостинг Б, зоны держатся на хостинге Б, но на хостинге А не удалили из DNS сервера записи о домене. Так получилось, например, что вы на том же хостинге А. Роутинг в этом случае идет в рамках подсети хостинга А, но сайта там уже нет, будет ошибка).

да много чего еще. Вы бы лучше уточнили, в чем ошибка? Отваливается по таймауту, DNS Error, Forbidden или что?

1. Это точно не так
2. Может быть, не проверял, но через поток сработало
3. Точно нет
4. Вот что выдает мне
PHP:
<? die(file_get_contents('http://www.audiovkontakte.ru/')); ?>

Код:
Forbidden
You don't have permission to access / on this server.
Additionally, a 500 Internal Server Error error was encountered while trying to use an ErrorDocument to handle the request.
 
забанили IP :)
попробуйте с другого хостинга
 
забанили IP :)
попробуйте с другого хостинга

Ага. Я заходил со своего хостинга и меня забанили по IP с первого же запроса. Если это было бы так, то получение страницы через stream тоже бы не прошло.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху