Ищу программу для лингвистического анализа текста

Тема в разделе "Софт", создана пользователем Solomon Kane, 10 май 2011.

  1. Solomon Kane

    Solomon Kane Постоялец

    Регистр.:
    26 авг 2009
    Сообщения:
    144
    Симпатии:
    9
    Ищу программу для лингвистического анализа текста со следующими требованиями:

    1) возможность подсчёта количества каждого слова в тексте с учётом стоп-слов;

    2) возможность работы сразу с 10, например, текстами;

    3) возможность сличать эти тексты между собой.

    По последнему пункту поясню. Есть, например, слово "apple". Программа должна показывать, сколько раз это слово встречается, как в каждом из текстов, так и во всех вместе взятых. То же касается и небольших фраз до 5 где-то слов.

    В идеале должно работать так:

    1) вбил 10 текстов;

    2) обработало;

    3) по каждому тексту могу посмотреть статистику;

    4) могу посмотреть статистику по всем текстам и по количеству сходных фраз и слов.

    В общем, как-то так. Если кто знает, пишите.

    Спасибо!

    P.S. Программа для английского языка, но, в принципе, нужна и для русского.
     
  2. General Fizz

    General Fizz Боевой Генерал :)

    Регистр.:
    11 апр 2007
    Сообщения:
    753
    Симпатии:
    396
    Это статистический анализ, а не лингвистический.

    По лингвоанализу (семантическому) есть фри софт (не весь) от АОТ.ру.

    Остальное в приватных наработках.

    По статанализу есть Wordstat, но для твоих нужд проще написать самому, например на перл или пхп. Ничего сложного там нет.
     
    Solomon Kane нравится это.
  3. Solomon Kane

    Solomon Kane Постоялец

    Регистр.:
    26 авг 2009
    Сообщения:
    144
    Симпатии:
    9
    Если бы я хотел что-то писать сам, то не искал бы программу :).

    А за исправления на счёт статический - спасибо. А такой анализ фразы может обрабатывать?
     
  4. Cobol

    Cobol Писатель

    Регистр.:
    14 мар 2007
    Сообщения:
    8
    Симпатии:
    3
    Можно начать работать с Pastukhov Keyword Harvester. Из достоинств одно - бесплатная.
     
    Solomon Kane нравится это.