Ставим точки перед новым предложением

Sankaboy

Постоялец
Регистрация
1 Фев 2012
Сообщения
112
Реакции
3
Привет. Помоги написать код, который бы ставил точки перед новым предложением. Вот только не знаю как обходить имена в предложении.
Наверно снова на str_replase?
За раннее спасибо!
 
Sankaboy, разве что огромным списком исключений... Кроме того, вот Вам пример для размышления:
– Точно! Они там все с заскоком, - ввернул Дэдди Большеног, сидевший тут же, за столиком (дело было, конечно, в «Ветке Плюща»). - А чего удивляться? Живут на неправильном берегу, почитай что в Пуще самой, а там - место дурное, даже если хоть полправды есть в том, что про этот лес болтают.
Властелин Колец. Братство Кольца.

Ну вот и посмотрите, сколько лишних точек перед заглавными наставит Ваш скрипт...

Здесь надо идти по пути Word: анализировать текст и предполагать, где с большей вероятностью нужна запятая или точка...
 
Sankaboy, не могу так же утверждать, но лёгкого решения не ищи. Как минимум большая база слов, как минимум пару месяцев на объяснение PHP пунктуации русского языка и т.д. Кроме того, всё это даст громадную нагрузку на хостинг...

Так что думай сам, насколько это нужно...
 
Можно забить базу имён. Это геморой ещё тот. Потом забить слова исключения и пускай скрипт когда видит заглавную букву проверяет по своей базе совпадения. Если их нет,то ставить точку. С другой стороны,если,стоп слово окажется последним в преложении...это уже второй геморой:)
 
перенес в более подходящее место
ТС, возможно вам следует пересмотреть алгоритм приложения?

имхо, адекватного распознавания, где точка является концом предложения а где нет (кроме имен существует куча исключений вроде г. Киев, ул. Хрещатик, В.В.Пупкин, 100 у.е., и т.д.) не существует
был бы - тогда наверняка монстры вроде разработчиков M$ офис или ОО офис ним бы воспользовались

буду рад узнать, если ошибаюсь
 
Ну тут нужен целый ИИ тогда)
А так повыдирать функции из доргенов.
 
Назад
Сверху