Поговорим про марковку?

Статус
В этой теме нельзя размещать новые ответы.
А почему бы просто текст не синонимизировать и не вставлять разные словечки типа таким образом, так как , по моему мнению. Тогда шинглы ломаются. и текст аболее уникальный стоновится.
 
Текст сгенеренный марковым - генерится по определенной математической системе. Палится такой же математической системой. У гугли даже патент где-то был на выявление маркова
Вроде вот он Для просмотра ссылки Войди или Зарегистрируйся

Там вроде ни одного упоминания о гугле то и нет,впрочем как и о генерации текста на основе цепей маркова.
А что ПС используют такую схему давно всем ясно.




2) Увеличение порядка цепочки - чтоб выбиралось не 2 слова подряд, а 3, 5 и т.д.
А зачем делать такое увеличение?
Ты возьми любой написанный текст.
И проверь выдачу по цепочке из 4 - 5 слов.
Найдет что-нибудь гугл по таким запросам? в 98% случаев нет.
Вывод: абсолютно бессмысленная цель.
Если было бы так, как то чего ты хочешь добиться, весь неуникальный текст давно бы был забанен. А в выдаче висел только копипаст.
Я думаю оптимальный вариант усовершенствовать маркова до 3 слов,что
довольно просто сделать, не сильно напрягая ресурсы.
 
А зачем делать такое увеличение?
Ты возьми любой написанный текст.
И проверь выдачу по цепочке из 4 - 5 слов.
Найдет что-нибудь гугл по таким запросам? в 98% случаев нет.
Вывод: абсолютно бессмысленная цель.
Если было бы так, как то чего ты хочешь добиться, весь неуникальный текст давно бы был забанен. А в выдаче висел только копипаст.
Я думаю оптимальный вариант усовершенствовать маркова до 3 слов,что
довольно просто сделать, не сильно напрягая ресурсы.
Цепи маркова умерли. нужно какой-то другой алгоритм придумывать. Ему же уже 4 года почти!
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху