Целесообразность маркова?

Тема в разделе "Вопросы новичков", создана пользователем Dimkich, 28 мар 2008.

Статус темы:
Закрыта.
  1. Dimkich

    Dimkich Постоялец

    Регистр.:
    10 июл 2007
    Сообщения:
    119
    Симпатии:
    36
    Есть ли смысл использовать генрацию текста марковым для доров?
    Интересно как себя ведут разные поисковики по отношеню к маркову?
    А то кажется что марков определяется поисковиками в большинстве случаев...
     
  2. maneak

    maneak Читатель

    Заблокирован
    Регистр.:
    29 авг 2007
    Сообщения:
    279
    Симпатии:
    43
    В ред баттоне:
    Имхо марков отжил своё, многие уже гласят о том что цепочки палятся ПС нараз.
     
  3. pashman

    pashman Создатель

    Регистр.:
    30 мар 2007
    Сообщения:
    16
    Симпатии:
    1
    Тогда объясни популярно, каким образом текст сгенереный марковым, можно вычислить. Это если не невозможно, то по крайней мере нескоро будет возможно.

    Вообще, кто знаток этих самый цепей, разъясните как это работает поподробней ;)
     
  4. zumasi

    zumasi Постоялец

    Регистр.:
    25 янв 2008
    Сообщения:
    143
    Симпатии:
    8
    По маркову получаеться ужасный текст. ИМХО и поисковики к подобным текстам относяться соответственно. В нормальных доргенах и в том-же RED Button есть нормальные алгоритмы преобразования текста. Так-что я думаю что про маркова уже можно забывать. Марков это +% ускорения бана дора.
     
  5. pashman

    pashman Создатель

    Регистр.:
    30 мар 2007
    Сообщения:
    16
    Симпатии:
    1
    Хорошо. Ужасный текст, пусть так. Но я вот, лично, не очень то верю в то, что можно проанализировать настолько глубоко текст. И лично мое мнение, что это может сделать только человек, не интеллект, а именно человек, потому как при чтении, человек анализирует прочитанное не только интеллектом, а еще и интуицией, домысливает, читает "между строк". Слишком велика вероятность ошибки робота, в результате которой полетят белые сайты. Обратите внимание только на работу его переводчика :D

    Все это миф, можно лишь усложнить фильтры (со стороны гугла, а со стороны нас, мы обманем его как "ребенка")
     
  6. IduKuru

    IduKuru

    Регистр.:
    20 янв 2008
    Сообщения:
    150
    Симпатии:
    20

    думаю миллионов страниц дорвеев в выдаче вполне достаточно для анализа и определения закономерностей в Маркове и соответственно создания алгоритма определяющего маркова. Думаю нашли какие то паттерны характерные текстам на основе маркова.
     
  7. zumasi

    zumasi Постоялец

    Регистр.:
    25 янв 2008
    Сообщения:
    143
    Симпатии:
    8
    И темболее у поисковиков явоно не глупые программеры, которые уже явно проследили написали фильтры для самого тапа марковского контента. Темболее если дор без редиректа, то там марком вообще и непокатит никак. На поисковики работают самые умные программеры, лохов туда не берут, а эти ребята знают своё дело.
     
  8. Dimkich

    Dimkich Постоялец

    Регистр.:
    10 июл 2007
    Сообщения:
    119
    Симпатии:
    36
    Мне кажеца, что дело не только в программерах...
    Я думаю, что если уж говорить о программерах, то с гугловсим баблом вполне реально поднять проэкт для определения даже смысла в тексте ( конечно же с некоторой долей вероятности). Но просто если такие алгоритмы и есть - они очень очень очень ресурсоёмки и делать такое просто бессмысленно.
    Так вот... Теоретически определять марков гораздо проще чем найти смысл в тексте... Может быть есть какой-нибудь нересурсоёмкий алгоритм? Чтобы поисковики могли его использовать.
     
  9. pashman

    pashman Создатель

    Регистр.:
    30 мар 2007
    Сообщения:
    16
    Симпатии:
    1
    Нереально. По сути им придется воссоздать человеческий анализ, чтоб на 95% (примерно) быть правыми.

    По маркову.
    Допустим русский язык, в словаре Даля 250к слов, представьте себе сколько вариантов, предложений можно создать осмысленных, учитывая все эти обороты речи, глаголы, всякие частицы, наречия, прилагательные, деепричастия, и естественно все уникальные. А если взять к примеру Шекспира, у него вообще сложная манера излагать свои мысли. А у людей есть такая штука, как неоконченная мысль, а тут нужно додумать, используя логику или еще что-то более глубокое... (и вот это последнее предложение, как робот определит, есть ли в нем смысл, это предложение сможет понять только человек). Можно только приблизить к идеалу и то не сильно. Все равно эта попытка поисковиков загонит их в ловушку еще более выгодную для нас с вами ;).

    Знаете когда умрет спам, доры и прочее серое, скорее всего никогда ?! :D
    Если только не случится чудо и наш всепланетный уровень морали подымится настолько, что наша совесть будет не позволять нам заниматься подобными вещами
     
  10. zmeyg

    zmeyg Писатель

    Регистр.:
    29 мар 2007
    Сообщения:
    9
    Симпатии:
    2
    А есть доргены, роботающие со словарями синонимов? И будет ли уникальным текст в котором например 6-8 процентов ключевиков заменить на другие? Например названия таблеток из одной группы. И текст будет читаемый и автоматизация.
     
Статус темы:
Закрыта.