Часто повторяемые слова

Тема в разделе "PHP", создана пользователем rus-us, 19 сен 2008.

Статус темы:
Закрыта.
Модераторы: latteo
  1. rus-us

    rus-us

    Регистр.:
    8 сен 2007
    Сообщения:
    153
    Симпатии:
    72
    Суть вопроса.
    Нужно из куска текста выбрать список самых повторяющихся слов, ну или посчитать количество повторений для каждого слова.
    Может есть готовые библиотеки?

    пс. с названием темы слегка ступил
     
  2. ZCFD

    ZCFD

    Регистр.:
    16 янв 2008
    Сообщения:
    989
    Симпатии:
    437
    зачем библиотека ?,разбиваешь текст на массив слов и проходишь по массиву со счетчиком , сортируешь масиив по убыванию
    можешь по-умноому слова в начальную форму преобразовывать при помощи phpMorphy


    код не большой получится
     
  3. a_n_d_y

    a_n_d_y

    Регистр.:
    26 мар 2006
    Сообщения:
    465
    Симпатии:
    61
    Проще некуда.
    PHP:
    $arr=explode(" "$text);
    $arr_new=array_count_values($arr);
    // $arr_new будет ассоциативный массив, в котором ключи будут словами, а значения количеством их повторений
    Текст конечно можно разбивать используя какие-то более сложные алгоритмы, чтоб удалить всякий хлам, но пример думаю понятен...
     
  4. RolCom

    RolCom

    Регистр.:
    12 мар 2008
    Сообщения:
    351
    Симпатии:
    108
    Из соседней темы уже была ссылка

    Перейти по ссылке

    Разбивает текст на слова и предложения, подсчитывает вес слов.
     
    Neow15ard нравится это.
  5. a_n_d_y

    a_n_d_y

    Регистр.:
    26 мар 2006
    Сообщения:
    465
    Симпатии:
    61
    Вроде бы сабж был тока о повторениях, но конечно из этого класса можно вытянуть че-нидь полезное для автора темы...
     
  6. phillip

    phillip

    Регистр.:
    4 сен 2007
    Сообщения:
    413
    Симпатии:
    15
    развивая тему- как подсчитать Процент содержания ключевика на странице? и еще такое дело... как доргены работают? как дорген запихивает именно 7% например ключевиков? он сначала высчитывает общую массу потом сколько надо ключевиков напихать? или как? я собрался писать хз как начать даже :nezn:
     
  7. RolCom

    RolCom

    Регистр.:
    12 мар 2008
    Сообщения:
    351
    Симпатии:
    108
    Вес слова как раз есть его повторения, в процентах к общему числу слов.
     
  8. R3$(0®p!0

    R3$(0®p!0 Прохожие

    Только нужно не забывать фильтровать предлоги, союзы, частицы и т.п.
     
  9. joefast

    joefast

    Заблокирован
    Регистр.:
    6 ноя 2007
    Сообщения:
    464
    Симпатии:
    74
    А ту же задачу но для словосочетаний никто не решал? В идеале, с приведением в начальную форму...
     
  10. Neow15ard

    Neow15ard

    Регистр.:
    27 ноя 2008
    Сообщения:
    422
    Симпатии:
    188
    C морфологией не разобрался правда еще
     

    Вложения:

Статус темы:
Закрыта.