Лечение Doubly-encoded to UTF-8 from CP1251

Тема в разделе "Базы данных", создана пользователем darmoid, 8 мар 2011.

Модераторы: latteo
  1. darmoid

    darmoid Киллер

    Регистр.:
    9 мар 2007
    Сообщения:
    375
    Симпатии:
    115
    В общем такая проблема. У меня есть дамп бд со старого вордпресс с крякозябрами. Если брать кусок текста, то пользуясь онлайн декодерами его можно легко перевести (только буква ш может не выводится, но не в этом суть).
    Если в консоли в Убунту сделать команду:
    Код:
    enca имя_файла
    то вот, что мне выдает
    Universal transformation format 8 bits; UTF-8
    Doubly-encoded to UTF-8 from CP1251
    Я же хочу перевести базу в UTF-8 без крякозябров.
    Вот кусок текста с базы: Залози внутріС?РЅСЊРѕС— секреції
    Помогите, пожалуйста знатоки :thenks:
     
  2. CrashX

    CrashX В прошлом XSiteCMS

    Регистр.:
    6 июн 2008
    Сообщения:
    682
    Симпатии:
    112
    могу конвернуть, вообще это делается на уровне копи паста
    открываешь в родной кодировке
    потом создаешь фаил в утф8 и делаешь паст и сохраняешь и вуаля но это не все
    далее в каждой таблице меняеш cp1251 на CHARACTER SET utf8 COLLATE utf8_general_ci;


    так же при коннекте делаешь SET NAMES UTF8

    ну вот как то так.