выдергивание емейлов с сайта

Статус
В этой теме нельзя размещать новые ответы.
сайт который граблю имеет кодировку
charset=windows-1251
кодировка на которой написан тот самый пхп-скрипт
utf-8
значения глобальных переменных MySQL character set client, character set connection, character set results, collation connection
как их просмотреть не знаю. просто в конекте выставляю
mysql_query("SET NAMES cp1251_general_ci");
mysql_query("SET CHARSET cp1251");

mysql_query("SET CHARACTER SET cp1251");
mysql_query("SET SESSION collation_connection = 'cp1251_general_ci'");
 
для начала, сделай iconv() - перегони полученный html с сайта в utf-8. после этого натравляй на него регулярку.

после того , как получишь имейлы, тебе надо определиться с используемой кодировкой БД.

В зависимости от того, в какой кодировке у тебя работает БД, тебе сразу после инициализации соединения с БД надо сделать запросы:

mysql_query("SET character_set_client='utf-8'"); //твой скрипт в utf-8
mysql_query("SET character_set_connection='utf8'"); //при соединении с БД используется utf-8
mysql_query("SET character_set_results='cp1251'"); //при записи в таблицу используется cp1251

посмотреть переменные можно через phpMyAdmin - ссылка "Системные переменные MySQL" (_http://your_server/phpmyadmin/server_variables.php)
 
убери все set names, set charset и попробуй так

mysql_query("SET NAMES cp1251");
 
Всем спасибо - разобрался.
_____________
Закройте топик так как все проблемы решил.
 
все на много проще

сразу после коннекта к базе данных надо выполнить 2 SQL запроса приведенный ниже

$query = "SET CHARACTER SET cp1251;";
$query = "SET NAMES cp1251;";

и проблема автоматически решается
кодировка в примере стоит такая как у меня, а ты можеш поставить какую тебе надо
 
ты темы читаеш? чеговек уже написал что разобрался
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху