[Помогите] Экспорт блога в PDF

Тема в разделе "Wordpress", создана пользователем dslava, 11 авг 2009.

Статус темы:
Закрыта.
Модераторы: DzSoft, Sorcus
  1. dslava

    dslava Коуч-консультант

    Регистр.:
    15 фев 2007
    Сообщения:
    220
    Симпатии:
    121
    Помогите решить такую задачу - экспортировать содержимое блога на вордпрессе в PDF с сохранением структуры постов, содержанием, поддержкой UTF...

    Видел плагины, которые могут сгенерировать PDF из отдельного поста - это не то.

    Видел онлайн сервисы, претендующие на то, что справляются с данной задачей. Не справляются. Сплошь выдают ошибки.

    Видел всякие геморные методы по установке на сайт LATEX, экспорту в него, а потом долгая работа в каких-то консольных прогах под Линуксом...

    Пожалуйста снабдите проверенным и желательно десктопным решением в один клик.
     
  2. o_nix

    o_nix

    Регистр.:
    7 ноя 2007
    Сообщения:
    1.073
    Симпатии:
    1.037
    Экспортируй wpxml почисть его от всего лишнего и преведи теги в html с помощью textpipepro

    Открой в офисе и пересохрани как pdf
    Или есть куча прог виртуальных принтеров в pdf например solidpdf converter

    Ну или спарсь весь сайт вебграббером и экспортируй в отдельные html файлы ... далее переведи в pdf

    Ещё как вариант издевательство над модулем rss ленты так чтобы она сразу весь сайт выдала ...

    Если нужна тупо копия сайта для оффлайнового просмотра то парсинг например teleportpro потом конверт в chm книгу из неё есть конвертеры в pdf
     
  3. dslava

    dslava Коуч-консультант

    Регистр.:
    15 фев 2007
    Сообщения:
    220
    Симпатии:
    121

    сложно и долго. хочется регулярно иметь возможность экспортировать содержимое нескольких блогов в pdf.

    чтобы было понятнее - эти блоги представляют собой интерактивные книги, постоянно дописывающиеся, с перелинкованными между собой постами, с регулярно появляющимися и значимыми для содержания комментариями. хочется их скажем раз в 1-2 дня экспортировать в формат удобный для локального просмотра.

    регулярно запускать парсеры сайта на предмет изменений - грустно. хорошо бы действительно работать с xml-экспортом.
    но его похоже надо долго допиливать вручную, потому как конвертеры (которые я пробовал) либо форматирование сайта теряют, либо русский не поддерживают, либо оглавление сайта не могут составить, либо картинки встроить в текст не могут...
     
Статус темы:
Закрыта.