UTF8 to CP1251 знаки вопроса

Тема в разделе "PHP", создана пользователем ivashka, 6 янв 2011.

Статус темы:
Закрыта.
Модераторы: latteo
  1. ivashka

    ivashka

    Регистр.:
    16 май 2007
    Сообщения:
    151
    Симпатии:
    15
    Здравствуйте.
    Написал парсер для одного польского сайта.
    Он в УТФ8, мой сайт в ср1251
    После получение страницы в УТФ8, мне нужно сделать матчинг по словам.
    Но в польском языке есть некоторые буквы с "черточками" сверху.
    В утф8 текст отображается нормально, но после iconv("UTF-8", "cp1251//TRANSLIT", page)
    У меня вместо этих букв отображаются знаки вопроса, остальной текст конвертируется нормально.
    параметр TRANSLIT, как я понимаю должен был заменить эти спец символы для польского языка, нашими символами.
    Тоесть о (с черточкой) заменить на простую о и т.д.
    Мне нужно текст сохранить читабельным но без этих символов, тоесть заменить их на наши.
    Как быть?
    Спасибо.
     
  2. -=ZorG=-

    -=ZorG=-

    Регистр.:
    18 авг 2010
    Сообщения:
    262
    Симпатии:
    47
    Файл в какой кодировке сохранен?
    Попробуйте поставить через Notepad++ кодировку и utf-8 and ANSI.
     
  3. nullsab

    nullsab Постоялец

    Регистр.:
    5 июн 2007
    Сообщения:
    65
    Симпатии:
    10
    PHP:
    $str 'A, Ą, B, C, Ć, D, E, Ę, F, G, H, I, J, K, L, Ł, M, N, Ń, O, Ó, P, R, S, Ś, T, U, W, Y, Z, Ź, Ż';
    echo 
    $str '<br />' iconv("UTF-8""cp1251//TRANSLIT"$str);
    Результат:
    Код:
    A, Ą, B, C, Ć, D, E, Ę, F, G, H, I, J, K, L, Ł, M, N, Ń, O, Ó, P, R, S, Ś, T, U, W, Y, Z, Ź, Ż
    A, A, B, C, 'C, D, E, E, F, G, H, I, J, K, L, L, M, N, 'N, O, 'O, P, R, S, 'S, T, U, W, Y, Z, 'Z, Z
    Может выводится текст без конвертации?
     
Статус темы:
Закрыта.