Foxit PDF Editor - использование для сканированных изображений Для чего нужна программа Foxit PDF EditorДля формирования Национальной электронной библиотеки Республики Коми требуется специализированное ПО, которое способно формировать файлы TIFF и PDF из сканированных документов. Важным функционалом программы является создание автоматически распознанного текстового слоя, кадрирование изображений, а также - возможность создания закладок. С этими задачами неплохо справлялся тандем программ «ABBYY Fine Reader» и «Adobe Acrobat». Однако, последнее время производители этих программ изменили политику продажи продукции и ввели подписочную систему. Это значит, что, если раньше программа покупалась один раз навсегда, теперь же на программы требуется ежемесячная или ежегодная подписка, что является непозволительной роскошью в условиях нестабильного финансирования библиотечного сектора сферы культуры.
Программа Foxit PDF Editor приобретается единожды и не требует подписки. Однако, по сравнению с FineReader, имеет более низкое качество распознавания текста. Использование программы Foxit PDF EditorВ данных рекомендациях не будет рассматриваться способ установки программы, будет рассматриваться лишь её использование, применяемое для формирования НЭБ РК. Интерфейс программыИнтерфейс программы (рис. 1) вполне интуитивно понятен. Как и многие современные программы под ОС Windows, в верхней части имеет вкладки и функциональные кнопки. Также не стоит забывать о кнопке сохранения в виде дискеты и кнопке возврата действия, которая вернёт на шаг назад последнее изменение в документе. Обе эти кнопки находятся на самой верхней плашке окна программы, а также во вкладке «Файл». Рис. 1. Начальное окно программы Foxit PDF Editor |
Получение изображенийПрограмма позволяет забирать обрабатываемые изображения прямо со сканера, при условии, что установлены необходимые драйвера и сканер подключен. Это может быть достаточно удобно, так как нет необходимости устанавливать и разбираться в нескольких программах.
Чтобы запустить сканирование, необходимо нажать на кнопку «из сканера» во вкладке «Главная» (рис. 2). Рис. 2. Получение изображений со сканера |
После, в открывшимся окне (рис. 3), необходимо убедиться, что выбран подходящий сканер. Если сканирование не ограничивается одной страницей, то необходимо поставить галочку «предложение отсканировать другие страницы». В поле «Вывод» необходимо поставить «Новый PDF-документ». Ставить галочку «Уменьшить размер и оптимизировать» - не нужно. Рис. 3. Настройки сканирования. Нужно отключить «Уменьшить размер и оптимизировать» |
После нажатия кнопки «сканировать» должно появиться окно интерфейса сканера. Оно может быть различным, в зависимости от драйверов и сканера, который Вы используете для сканирования (рис. 4). На этом этапе необходимо убедиться, что сканирование производится согласно Техническим Требованиям оцифровки изданий. Как правило, это цветные изображения с разрешением не менее 300 dpi. Рис. 4. Окно интерфейса может отличаться |
Далее, если есть необходимость отсканировать более 1 страницы, необходимо выбрать пункт «сканировать другие страницы» и нажать ОК (рис. 5) Рис. 5. Для продолжения сканирования необходимо выбрать этот пункт |
После того, как все необходимые страницы были отсканированы, необходимо завершить сканирование. Рис. 6. Рис. 6. Для завершения сканирования выберете этот пункт |
Изменение вида просмотраПо умолчанию просмоторщик программы не позволяет плавно переходить между страницами, т.е. не работает прокрутка. Чтобы это исправить, во вкладке «Вид» необходимо включить режим «Непрерывный» (см. рис. 7.) Рис. 7. Для удобства работы можно включить этот режим |
Сохранение в формате Тиф (TIFF)На данном этапе есть смысл сохранить промежуточный результат сканирования. При этому неважно, происходило сканирование разворотами или постранично, отсканированные изображения лучше сохранить. Это будут файлы формата TIFF.
Для этого необходимо во вкладке «Файл» выбрать пункт «Экспорт», на белом поле выбрать «В изображение», далее тип изображения «TIFF». После чего должно появиться окно проводника, с помощью которого необходимо выбрать папку сохранения и название файлов. В этом окне можно настроить выходной формат и диапазон страниц, если нажать на кнопку «Настроить». Здесь необходимо выбрать все страницы, сжатие LZW, цветовое пространство «Цвет», а также разрешение 300 пкс/дюйм. После чего нажать последовательно кнопки «Ок» и «Сохранить». Рис. 8. Порядок действий для сохранения в формате TIFF |
Для завершения этой операции необходимо сохранить PDF-документ, о чём предупредит всплывающее окно. В появившемся окне нужно будет нажать «Да» Рис. 9. Для экспорта TIFF необходимо сохранить PDF файл |
После чего необходимо в проводнике выбрать папку сохранения PDF, ввести название файла и подтвердить сохранение, нажав кнопку «Сохранить» (рис. 10). Рис. 10. Сохранение в формате PDF |
Если сканировали обе страницы раскрытой книгиСтоит удостовериться, что в папке сохранились тифы. Для этого нужно открыть папку, в которую сохранялись изображения. Теперь, чтобы была комфортная дальнейшая обработка, необходимо сделать копии изображений, которые сканировались разворотом (т.е. две страницы на один скан). Для этого следует выбрать такие изображения, зажать клавишу CTRL и с зажатой ЛКМ потянуть в сторону на свободное поле. Как итог, в исходную папку должны добавиться изображения с окончанием «- копия» (см. рис. 11) Рис. 11. Создание копии скана разворота страниц |
Создание PDF из изображенийДля последующей обработки документов, необходимо собрать полученные изображения в единый файл. Для этого в программе необходимо зайти во вкладку «Файл», выбрать пункт меню «Создать», выбрать пункт «Объединить файлы», нажать на кнопку «Объединить файлы» правее меню (рис. 12) Рис. 12. Создание PDF из сохраненных TIFF-файлов |
Затем, в появившемся окне необходимо нажать кнопку «Добавить файлы» (рис. 13), после чего в окне проводника выбрать необходимые файлы и добавить их в проект. Рис. 13. Окно добавления файлов |
Исправление перекоса страницПосле завершения процесса объединения файлов, в программе откроется PDF-файл, с которым можно работать дальше. Для начала нужно исправить перекос изображения это делается двумя способами:
1. Вручную, когда выбирается инструмент редактирования изображений через вкладку «Главная» - редактирование объектов – изображения (см. рис. 14). Так же этот способ может понадобится, если на изображении нет символов для распознавания.
Рис. 14. Кнопка редактирования объектов |
Затем можно поворачивать страницы на угол кратный 90 с помощью иконок, или же на произвольный угол, используя шкалу с цифровым вводом (вручную). См. рис. 15 Рис. 15. В правой части экрана можно изменять угол поворота изображения |
2. Второй способ – автоматический. С помощью кнопки «быстрое распознавание» на вкладке «Главная», программа сама приведёт страницы в необходимую ориентацию, а также исправит перекосы изображений (рис. 16). Рис. 16. Быстрое распознавание позволит исправить перекос страниц |
Обрезка страницСледующий шаг для формирования Тифов и PDF файла – обрезка лишнего на страницах. Вокруг страницы не должно быть слишком больших полей, чтобы размер файла не раздувался, и, в то же время, достаточный, чтобы вместиться в рамки, установленные Техническими требованиями по оцифровке изданий для НЭБ РК.
Чтобы обрезать страницы, необходимо зайти во вкладку «Организовать», затем выбрать кнопку «Обрезать страницы». (рис. 17). Рис. 17. Инструмент для обрезки страницы |
После выбора этого инструмента, необходимо с зажатой ЛКМ выделить область, которая будет обрезана (рис. 18). Затем применить кадрирование ко всему документу, применив настройки в следующем окне (рис. 19). Рис. 18. Выбор области кадрирования |
Цифры в разделе «Управление полями» Сверху, Снизу, Слева, Справа означают, на сколько будет подрезана страница в соответствующих единицах.
Если страницы отличны по размеру, то, прежде чем применять обрезку полей, следует привести страницы к одному размеру, это можно осуществить в разделе «Изменить размер шрифта». Можно сделать заведомо самый большой размер, чем самая большая страница, выбрав необходимый пресет. Рис. 19. Настройки изменения размера страниц |
Теперь необходимо выровнять страницы относительно отрезного поля. Это можно сделать, перемещая изображение страницы с помощью зажатой ЛКМ. Для этого необходимо выбрать инструмент редактирования изображений (вкладка «Изменить» - кнопка «Редактирование объектов» - «Изображения») (см. рис. 20) Рис. 20. Двигать страницу можно инструментом «Редактирование объектов» |
Дальнейшие шагиПосле того, как все страницы выровнены, следует опять сохранить изображения страниц в формате TIF. Файл – экспорт – в изображения – TIFF (300 dpi, цветные, сжатие LZW). Это те тифы, которые считаются исходными изображениями, они будут храниться в фондах НЭБ РК.
Далее необходимо повторить операцию с обрезкой и выравниванием страниц, чтобы сформировать PDF (рис. 21). Рис. 21. Обрезанный PDF-файл, который пойдёт в НЭБ РК |
Распознавание текстаТеперь необходимо распознать текст. Для этого необходимо выбрать вкладку «Преобразовать», затем нажать на флажок кнопки «Распознавание текст», далее «Текущий файл». (рис. 22) Рис. 22. Кнопка распознавание текста |
После появится окно, в котором необходимо настроить способ распознавания текста. Кроме выбора страниц и русского языка (коми языка в программе не предусмотрено), необходимо выбрать режим распознавания «Изображения с текстом для поиска» (рис. 23) Рис. 23. Настройки распознавания текста |
На данном этапе рекомендуется сохранить PDF-файл, чтобы избежать потери данных. Создание закладокЕсли в издании присутствует содержание или оглавление, то его нужно продублировать в закладках. Чтобы их открыть, достаточно нажать на значок флажка на левой панели программы (см. рис. 24). Затем, перейдя на необходимую страницу следует нажать ПКМ на ней, и выбрать «Добавить закладку» (можно использовать сочетание клавиш CTRL+B). Закладки можно редактировать, менять их название, можно перемещать, можно вкладывать друг в друга. Рис. 24. Добавление закладок в PDF |
Теперь осталось сохранить PDF. Для этого выбирается вкладка «Файл», затем «Сохранить как». После чего следует выбрать путь сохранения.
Файл с методическими рекомендациями можно скачать ниже:
|