Как подсчитать плотность ключевых слов в тексте?

Тема в разделе "Как сделать...", создана пользователем Nezzar, 30 апр 2008.

Статус темы:
Закрыта.
  1. Nezzar

    Nezzar

    Регистр.:
    29 дек 2006
    Сообщения:
    338
    Симпатии:
    71
    Вот хочу написать свой скрипт, который будет подсчитывать плотность ключевых слов(будет брать прямо из текста, т.е. не будут задаваться) из предложенного текста. И не только слов по одному, но и словосочетания.

    Как такое реализовать?
     
  2. Dimkich

    Dimkich Постоялец

    Регистр.:
    10 июл 2007
    Сообщения:
    119
    Симпатии:
    36
    Вопрос конечно многим интересный...:)
    Но вот чтобы даже не задавались сами кейворды... Тут сложновато будет. Как вот скрипт должен понять какое слово кейворд, а какое нет? Для англ. например the, is, do думаю будет гораздо выше по частотности чем любое cheap, online, porno.
    А по теме:
    например сначала удаляем из текста всё что не пробел и буква ( preg_replace("#[^a-zA-Z ]+#i", '' ,$text) ) потом в нижний регистр. Потом разбиваем на слова $words=explode(' ', $text). И погнали.
    PHP:
    for ($i=0$i<count($words); $i++) {
       if (!isset(
    $keywords[$words[$i]]) {
          
    $keywords[$words[$i]]=1;
       } else {
          
    $keywords[$words[$i]]++;
       }
    }
    Получившийся массив сортируем по убыванию и где то там сверху массива будут и кейворды.
    Точно такие же операции можно проделать чтобы получить массивы для 2-х 3-х 4-х словных текстовых вхождений.
    Примерно так...:ah:
     
    Nezzar нравится это.
  3. Poster

    Poster дизайнер

    Регистр.:
    13 сен 2006
    Сообщения:
    100
    Симпатии:
    31
    такой клас в сети бродил когдато
     

    Вложения:

    • inc.density.zip
      Размер файла:
      1,5 КБ
      Просмотров:
      32
    Ragger и Nezzar нравится это.
Статус темы:
Закрыта.