Технология разбавления текста ключевиками

Тема в разделе "Вопросы новичков", создана пользователем expro, 23 апр 2009.

Статус темы:
Закрыта.
  1. expro

    expro Постоялец

    Регистр.:
    2 мар 2009
    Сообщения:
    51
    Симпатии:
    2
    Очень интересует сабж…
    Ничего кроме схемы "Текст текст. Кей. Текст." и "Кей, текст. Текст." в голову не приходит… буду очень благодарен если кто–нибудь поможет в данном вопросе ;-)
     
  2. Zerrikanez

    Zerrikanez Прохожие

    Что-то не видно "Текст кей, текст, кей текст."... Ну т.е. кей в тексте, а не кей как начало предложения или отдельное предложение.

    Есть вариант, но он достаточно спорный:
    1. Анализируем текст и разбиваем на части речи.
    2. Генерируем новый текст по шаблонам предложений.
    3.а. На место существительного всталяем нужный нам кей. (Если правильно помню, так DMII работает)
    ИЛИ
    3.б. Анализируем кей и вставляем на соответствуещее место в шаблоне.


    На выходе - грамматически верный текст...:
    а) С косяками в виде нагло вставленных кеев. (но не очень уж нагло...)
    б) Полностью грамматически верный текст, но процент ключевых слов будет сильно отличатся от заданного.


    п.с. ИМХО вариант А лучше.
    п.с.с. А вообще то, марков вроде пока у многих работает нормально... а там с ключевиками особых маневров не сделаеш. :)
     
  3. expro

    expro Постоялец

    Регистр.:
    2 мар 2009
    Сообщения:
    51
    Симпатии:
    2
    Ну да… первый вариант, который ты предложил я обдумывал… но в этом случае прийдется долго заморачиваться над phpmorphy…
     
  4. baddan

    baddan

    Регистр.:
    14 мар 2008
    Сообщения:
    354
    Симпатии:
    42
    А иначе ни как.

    Есть еще вариант искать в тексте точки либо запятые пропустив слова из 1/3х буков(тоесть предлого "но","а","что","but" и т.д можно и словарь предлогов сделать) и после них вклеивать кей. таким методом можно как сам понимаеш сначало посчитать теже самые точки и запятые и в зависимости какой % хочеш получить столько их и пропускаеш.

     
  5. smithws

    smithws

    Регистр.:
    19 июн 2008
    Сообщения:
    481
    Симпатии:
    153
    А можно после каждой точки вставлятьсвое предложение, скажем, в скобках (бла-бла-бла:(Dграмматически выверенное, но с ключевиками
     
  6. bobboy7

    bobboy7 Постоялец

    Регистр.:
    29 авг 2007
    Сообщения:
    140
    Симпатии:
    52
  7. Bags85

    Bags85 Постоялец

    Регистр.:
    3 июл 2008
    Сообщения:
    68
    Симпатии:
    6
    <удалено by SolutionFix, так как я потер предыдущий пост>
    Глянул генератор, до ужаса просто сделан. Как понимаю примерно по этому же принципу работает морфологический модуль VVS мода РБ. Только в этом скрипте надо ручками писать шаблоны, а это ой как запаристо, да и собирать руками же базу... В морф. модуле VVS всё это делается на автомате(ну или полуавтомате). Если что сильно не пинайте сам морф модуль в руках не держал, судил по описаниям и видео.
     
  8. ko-yg

    ko-yg

    Регистр.:
    12 ноя 2008
    Сообщения:
    519
    Симпатии:
    161
    про ВВ, ты почти прав - схема такая - есть слоыварь/словари, есть некий текст. На основе текста и словаря - формируется "описывающая маска" (ручками ручками ;) - каждое слово в тексте описывается минимум по 5 параметрам - часть речи, род, спряжение, склонение, часть предложение итд) - далее на основе этой маски будет:
    - во-первых синонимайзер работать, т.е. менять "мальчик" на "папцан"
    - во вторых будут строится новые предложения (мы ж описывали "скелеты" по частям предложения - вот по этим скелетам и будет фигачка идти)
    На самом деле моё скромное ХО - хоть ВВ ещё достаточно сырой материал, но внимания достоен безусловно - идея прикрутить к доргену синонимайзер с функциями генерации - это перспективно, и если чесно мне кажется намного перспективнее на данный момент, чем "нейронная сеть", котрую лезвие уже год мучает ;)
    единственное фе - для качественной работы словарь желательно сделать, скажем так - оъемным + сделать приличную маску - а это и время и машинный ресурс - у меня на локалке скрипт достаточно туго идет, если текста больше 1 мб в буфе.
    вот такие дела.
     
  9. expro

    expro Постоялец

    Регистр.:
    2 мар 2009
    Сообщения:
    51
    Симпатии:
    2
    Ну… собственно он генерирует контент, а не подмешивает ключевики))
     
  10. bobboy7

    bobboy7 Постоялец

    Регистр.:
    29 авг 2007
    Сообщения:
    140
    Симпатии:
    52
    посмотри повнимательней сначала. ключевики скидываются в несколько файлов и вместе с ними генерируется контент.
     
Статус темы:
Закрыта.