UTF8 to CP1251 знаки вопроса

Статус
В этой теме нельзя размещать новые ответы.

ivashka

Полезный
Регистрация
16 Май 2007
Сообщения
151
Реакции
15
Здравствуйте.
Написал парсер для одного польского сайта.
Он в УТФ8, мой сайт в ср1251
После получение страницы в УТФ8, мне нужно сделать матчинг по словам.
Но в польском языке есть некоторые буквы с "черточками" сверху.
В утф8 текст отображается нормально, но после iconv("UTF-8", "cp1251//TRANSLIT", page)
У меня вместо этих букв отображаются знаки вопроса, остальной текст конвертируется нормально.
параметр TRANSLIT, как я понимаю должен был заменить эти спец символы для польского языка, нашими символами.
Тоесть о (с черточкой) заменить на простую о и т.д.
Мне нужно текст сохранить читабельным но без этих символов, тоесть заменить их на наши.
Как быть?
Спасибо.
 
Файл в какой кодировке сохранен?
Попробуйте поставить через Notepad++ кодировку и utf-8 and ANSI.
 
PHP:
$str = 'A, Ą, B, C, Ć, D, E, Ę, F, G, H, I, J, K, L, Ł, M, N, Ń, O, Ó, P, R, S, Ś, T, U, W, Y, Z, Ź, Ż';
echo $str . '<br />' . iconv("UTF-8", "cp1251//TRANSLIT", $str);
Результат:
Код:
A, Ą, B, C, Ć, D, E, Ę, F, G, H, I, J, K, L, Ł, M, N, Ń, O, Ó, P, R, S, Ś, T, U, W, Y, Z, Ź, Ż
A, A, B, C, 'C, D, E, E, F, G, H, I, J, K, L, L, M, N, 'N, O, 'O, P, R, S, 'S, T, U, W, Y, Z, 'Z, Z

Может выводится текст без конвертации?
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху