Получение лемм и словосочетаний из текста?

Статус
В этой теме нельзя размещать новые ответы.

Atec

Мастер
Регистрация
28 Апр 2007
Сообщения
296
Реакции
32
День добрый всем, собственно имеется текст, необходимо с помощью пхп обработать текст таким образом чтобы получить 2 массива, "Наиболее часто встречающиеся леммы" и "Словосочетания"... собственно нужно чтобы работало как на

Помогите, выдумывать что либо не хочется, т.к. времени мало, думаю может у кого есть готовый класс, или хотя бы пару полезных функций, в общем помогите кто чем может, с меня спасибко :)
 
Народ, неужели никому не интересна данная тема :) это ж позволит делать ключи и описания очень просто и автоматом...

У меня пока получается только выделить все слова и найти количество вхождений каждого из слов, но это для больших текстов очень много времени занимает...
 
Может поможет консольный вариант тузлы Яндекса для нахождения словоформ? (Можно было скачать раньше где-то в глубинах сайта Яндекса)

Добавлено через 20 минут
К сожалению не могу найти у себя то, что качал. И не помню названия программы.
 
Тулза была на php или WIN приложением?
 
компилируемое приложение. На сколько помню были версии и под win и под nix.

Добавлено через 10 минут
НАШЕЛ!


Короче пригодится для выделения основной формы слова из какой-то производной!
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху