Ищу Проблемы с сохранением pdf

Тема в разделе "Софт", создана пользователем krava, 19 май 2010.

Статус темы:
Закрыта.
  1. krava

    krava Создатель

    Регистр.:
    12 сен 2007
    Сообщения:
    40
    Симпатии:
    10
    Возникла проблема с копированием информации с pdf файла.
    В фоксит ридере просматривается без проблем но при копировании информации удаляются все пробелы с текста, а при сохранении файла в ТХТ формат добавляется в текст еще и китайский перевод :(
    Примеры во вложении.
    Подскажите, как с этим бороться.
     

    Вложения:

    • 1.jpg
      1.jpg
      Размер файла:
      110,2 КБ
      Просмотров:
      3
    • 1.txt
      Размер файла:
      4,8 КБ
      Просмотров:
      1
  2. Delk0

    Delk0

    Регистр.:
    26 мар 2010
    Сообщения:
    288
    Симпатии:
    57
    krava нравится это.
  3. comua

    comua Постоялец

    Регистр.:
    26 фев 2008
    Сообщения:
    110
    Симпатии:
    31
    Прогони pdf через FineReader, чтоб он его распознал.
     
  4. krava

    krava Создатель

    Регистр.:
    12 сен 2007
    Сообщения:
    40
    Симпатии:
    10
    Спасибо програмка PDF Able2Extract Pro 6.0 работает
    Она действительно как OCR распознает файл, местами иногда некоректно, но 2-3 % подправить ручками не проблема. Тем более если текст нужно вычитать.
    Бумаю FineReader тоже сгодится.
     
  5. Delk0

    Delk0

    Регистр.:
    26 мар 2010
    Сообщения:
    288
    Симпатии:
    57
    Нет смысла гонять через файнридер, если пдф текстовый.
     
  6. krava

    krava Создатель

    Регистр.:
    12 сен 2007
    Сообщения:
    40
    Симпатии:
    10
    Чего на сколько я понимаю PDF Able2Extract Pro работает по такой же схеме.
    Конечно, если на компе нет никакой программы, то лучше поставить Able2Extract т.к. она меньше и компактнее, но если у чела есть файнридер ... то сам бог велел :)
     
  7. Delk0

    Delk0

    Регистр.:
    26 мар 2010
    Сообщения:
    288
    Симпатии:
    57
    Ошибаешься, есть несколько видов пдф:
    Есть скан загнанный в пдф, и для его распознавания ничего лучше файнридера нет, а есть просто форматированный текст с картинками и таблицами, который сконвертили в пдф для удобства работы и защиты от копирования. Для 2-го случая и используется able2extract. И именно этот случай мы здесь рассматриваем.
     
Статус темы:
Закрыта.