Синонимизация MySQL

Тема в разделе "Тех. вопросы", создана пользователем Kosiak, 8 июл 2009.

Статус темы:
Закрыта.
  1. Kosiak

    Kosiak

    Регистр.:
    12 сен 2006
    Сообщения:
    612
    Симпатии:
    73
    Каким образом (с помощью каких тех. средств) можно уникализировать дамп mysql? По словарю, по прямым заменам (массово, по regexp например)... Наведите на мысль, и если есть на готовое решение...
     
  2. Neow15ard

    Neow15ard

    Регистр.:
    27 ноя 2008
    Сообщения:
    422
    Симпатии:
    188
    Надеюсь все прально понял .
    Самый простой вариант - накатать парсилку на php и прогнать все на денвере.(+ серверный синонимайзер, тут выложен гдето syn2)
    если нужен дестопный софт то с регулярками можно в notepad++ , а в куче разных файлов textreplacer есть.
    дамп по сути ничем от txt файла не отличается , в чем сложность?
     
  3. qwerty_on

    qwerty_on Прохожие

    Берете базу мускула. Копируете из нее строки с постами. Вставляет в новый txt файл. Затем Находите синонимайзер с русским словарем (смотрите что бы там не было англ. слов). Пропускаете файл через синонимайзер. Итог от синонимазии копируете и вставляет в файл мускула вместо строк с постами.
     
  4. extrimportal

    extrimportal

    Регистр.:
    28 ноя 2008
    Сообщения:
    561
    Симпатии:
    74
    А 500 к полюбому быстро не получится, чего орать то? Человек просто предложыл вариант, кроме того незная еще что вы хотите стока текста перебрать. Иль то серверный синонимайзер или десктопный или же сам ноутпад, 500 к строк пахать будет долго. Здесь думаю самым оптимальным вариатом будет разделить на пару частей и прогнать через пхп. Эт мое мнение...
     
  5. Kosiak

    Kosiak

    Регистр.:
    12 сен 2006
    Сообщения:
    612
    Симпатии:
    73
    В вопросе были все данные для правильного ответа. Из вопроса прямо следовало, что ручной вариант невозможен:
    Понятия "долго" и "физически невозможно" разные, ведь так?
    Если на перле долго - это макимум 30-40 минут, то для человека это будет 30-40 лет (действительно долго, как я не подумал :-])
     
  6. masteruka

    masteruka

    Регистр.:
    29 дек 2006
    Сообщения:
    208
    Симпатии:
    310
    Синонимизировать дампы можно SmartRewriter вот здесь есть вылеченый
     
  7. ikolibri

    ikolibri

    Регистр.:
    3 ноя 2008
    Сообщения:
    205
    Симпатии:
    14
    только хотел написать, опередили оказывается.

    любой дам, переименовываем в тхт и любым синонимайзером как текст, только надо знать, заменяются ли по базе синонимов цифры на слова, не то база потом работать не будет
     
  8. X-Core

    X-Core Создатель

    Регистр.:
    10 окт 2006
    Сообщения:
    29
    Симпатии:
    5
    Естественно база работать не будет, в любом случае заменяется что либо в коде и бб, такой ламо способ не катит, нужен софт именно для работы или с дампами или с базами напрямик.
     
  9. ikolibri

    ikolibri

    Регистр.:
    3 ноя 2008
    Сообщения:
    205
    Симпатии:
    14
    в чём жк он ламо, если обращать внимание на структуру базы и учитывать ее?
     
  10. X-Core

    X-Core Создатель

    Регистр.:
    10 окт 2006
    Сообщения:
    29
    Симпатии:
    5
    Руками выдирать что ли предлагаешь? Или напиши пост что бы понятно было о чем ты. Вся суть в синонимизации крупных дампов или баз в целом.

    Любой синонимайзер не заточенный под это конкретно, просто смешает коды таблиц и все - такой дамп бесполезен будет уже, потому нужна специализированная для этого прога.
     
Статус темы:
Закрыта.