анализ текста. как выделить абзацы из текста

Тема в разделе "PHP", создана пользователем casher, 20 апр 2010.

Статус темы:
Закрыта.
Модераторы: latteo
  1. casher

    casher

    Регистр.:
    24 фев 2008
    Сообщения:
    168
    Симпатии:
    17
    Для анализа текста необходимо выделить абзацы из большого текстового файла. Построчно анализировать текст не получиться, т.к. разбиваются предложения, а они нужны целыми.
    Вопрос: подскажите в какую сторону копать? может алгоритм или на какую функцию обратить внимание?
    Спасибо.

    зы. думал может читать построчно и склеивать в одну переменную пока не встетится двойной перевод строки и ... на этом мысль обрывается (
     
  2. saen

    saen

    Регистр.:
    6 авг 2006
    Сообщения:
    756
    Симпатии:
    129
    вот простой пример разбиения текста на абзацы по двойному переносу строки:
    PHP:
    $text file_get_contents('1.txt');
    $data explode("\r\n\r\n"$text);
    print_r($data);
     
  3. casher

    casher

    Регистр.:
    24 фев 2008
    Сообщения:
    168
    Симпатии:
    17
    а если файл 1.txt имеет 50мб и более, сервер не загнётся?
     
  4. saen

    saen

    Регистр.:
    6 авг 2006
    Сообщения:
    756
    Симпатии:
    129
    может. во избежание этого надо читать файл кусочно и склеивать в переменную до тех пор, пока не найдется двойной перенос строки. дальше уже делаешь с ней что хочешь
     
  5. x00xer

    x00xer Создатель

    Регистр.:
    30 мар 2009
    Сообщения:
    29
    Симпатии:
    2
    Тогда лучше через CLI его прочитать и отдать скрипту, либо сделаеть все необходимое авком или еще чем
     
  6. casher

    casher

    Регистр.:
    24 фев 2008
    Сообщения:
    168
    Симпатии:
    17
    можно по подробнее, что есть "CLI" и "авк"?
     
  7. saen

    saen

    Регистр.:
    6 авг 2006
    Сообщения:
    756
    Симпатии:
    129
    CLI это командная строка операционной системы
     
Статус темы:
Закрыта.