• DONATE to NULLED!
    Форуму и его команде можно помочь, мотивировать модераторов разделов.
    Помогите модератору этого раздела killoff лично.

Поиск автоматизация публикации отсканенного контента.

Статус
В этой теме нельзя размещать новые ответы.

Revenant425

Мастер
Регистрация
16 Авг 2008
Сообщения
200
Реакции
31
может у кого есть какие-то свои наработки.есть контент в пдфнике, нужно его повставлять.Самая большая проблема в том, как это дело все пролинковать.У книг есть содержание, так вот хочется сделать все это ввиде книги с ссылками на страницы.также может кто знает есть ли какие программы убирающие переносы и форматирование текста из pdf?
 
Прямо из PDF не получится.
Как делал я, когда работал со сканом:
1. Загружаю PDF в ABBYY FineReader, распознаю
2. Сохраняю в TXT, чищу отличной прогой Decorator Pro
3. Делаю заголовки по типу ##Заголовок
4. Пощу в DLE своей программой
Ручной работы довольно много, но качество на выходе очень высокое. Можно исключить какие-то этапы (например, доверить разбивку на статьи скрипту), но качество от этого пострадает.
 
Есть так же afterscan
Сайт программы:

В сети имеются ломанные версии.
 
Прямо из PDF не получится.
Как делал я, когда работал со сканом:
1. Загружаю PDF в ABBYY FineReader, распознаю
2. Сохраняю в TXT, чищу отличной прогой Decorator Pro
3. Делаю заголовки по типу ##Заголовок
4. Пощу в DLE своей программой
Ручной работы довольно много, но качество на выходе очень высокое. Можно исключить какие-то этапы (например, доверить разбивку на статьи скрипту), но качество от этого пострадает.
первые два пункта отпадают, у меня даже не сканы, а исходники набранного текста.Единственных их минус - это переносы в словах и всякие формулы с табличками.А что там за свои проги?.Не поделитесь? =).Да в идеале загнать текст в скрипт, чтобы он его разбил по страничкам.Чтобы в статьях были кнопочки "далее" и "назад".Ибо вчера весь вечер убил, чтобы проставить ссылки на ~80 страницах и не запутаться.
 
первые два пункта отпадают, у меня даже не сканы, а исходники набранного текста.Единственных их минус - это переносы в словах и всякие формулы с табличками.А что там за свои проги?.Не поделитесь? =).Да в идеале загнать текст в скрипт, чтобы он его разбил по страничкам.Чтобы в статьях были кнопочки "далее" и "назад".Ибо вчера весь вечер убил, чтобы проставить ссылки на ~80 страницах и не запутаться.

К сожалению, поделиться не могу - это скрипты и они очень заточены под мою систему, вряд ли смогу куда-то перенести, да и денег они стоили немало. Вам лучше всего заказать то, что нужно, на фрилансе - выйдет и недорого и именно то, что Вам нужно.
Кстати, подтверждаю - AfterScan отличная прога - забыл как называется, поэтому не указал :)
 
К сожалению, поделиться не могу - это скрипты и они очень заточены под мою систему, вряд ли смогу куда-то перенести, да и денег они стоили немало. Вам лучше всего заказать то, что нужно, на фрилансе - выйдет и недорого и именно то, что Вам нужно.
Кстати, подтверждаю - AfterScan отличная прога - забыл как называется, поэтому не указал :)
проблема в том, что дело скорее всего не стоит свечь, но влюбом случае спасибо за проги выше :).если кому интересно нашел её на рутрекере с таблэткой
 
AfterScan когдато пользовался. Да процес упросчает но чтоб прям усе чистила ето нет. Все равно приходилось за ней в ручную чистить но уже намного меньше.
Можеш для постинга републишер взять он поддерживает импорт с текстових файлов и вроде в дле можно импоритировать , в нас если на форуме викладена, да и формат тхт файлов в теме есть. Немного поволочится с настройкой и будет тебе постинг скана и по времени мож розтянуть, или посмотри в сторону текскита или зеброида но ето уже платние решения.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху