Шрифт:
Интервал:
Закладка:
Рис. 4.11. Выбор символа для распознавания
В данном окне содержится библиотека символов, которые можно использовать в процессе распознавания документов. В нашем случае следует выбрать цифру 1; для этого выделим ее щелчком мыши и нажмем кнопку Вставить. В результате она отобразится в поле Введите символ, выделенный рамкой (см. рис. 4.10), и чтобы зафиксировать в эталоне замену, нажмем кнопку Обучить.
СОВЕТПри обучении шаблона вы можете назначать символам дополнительные эффекты: включать полужирное или курсивное начертание, а также применять верхний или нижний индекс. Для этого достаточно установить соответствующие флажки, расположенные внизу окна в области Эффекты (см. рис. 4.10).Сразу после этого рамка в верхней части окна Ручное обучение эталона автоматически переместится на следующий непонятный программе символ. В нашем случае это – буква Ф, являющаяся первой в слове Фамилия (рис. 4.12).
Рис. 4.12. Следующий этап ручного обучения
Как видно на рисунке, в данном случае программа идентифицирует прописную букву Ф со строчной буквой о, что является ошибкой. Чтобы исправить ее, нажимаем рядом с полем Введите символ, выделенный рамкой кнопку выбора, затем в открывшемся окне (см. рис. 4.11) щелчком мыши выбираем прописную букву Ф и нажимаем кнопку Вставить, а в режиме обучения – кнопку Обучить.
Аналогичным образом обучим Fine Reader распознавать все остальные незнакомые символы в данном документе. Если какой-то символ, в правильности которого Fine Reader сомневается, распознан все же верно – при обучении его можно проигнорировать, нажав кнопку Пропустить (см. рис. 4.12). Для возврата к предыдущему символу используйте кнопку Вернуться.
ВНИМАНИЕПри нажатии кнопки Вернуться рамка переместится на предыдущую позицию, при этом последняя настроенная аналогия (т. е. пара «изображение – символ») будет автоматически удалена из данного шаблона. Помните, что данная кнопка функционирует лишь в пределах одного слова.После того как обучение эталона завершено, нажмите кнопку Закрыть. При этом программа выдаст запрос относительно сохранения выполненных в эталоне изменений. Чтобы впоследствии применять данный пользовательский эталон с учетом последних изменений, нажмите кнопку Да. При нажатии Нет они будут утрачены, но и в первом, и во втором случае начнется процесс распознавания документа с применением эталона. Чтобы отказаться от немедленного распознавания и возврата в режим обучения нажмите кнопку Отмена.Если все сделано правильно, то в результате распознавания текста с применением пользовательского эталона наш фрагмент документа будет выглядеть так, как показано на рис. 4.13.
Рис. 4.13. Результат корректного распознавания текста
После распознавания документа тексту можно придать более эргономичный вид, используя для этого инструменты форматирования и оформления, знакомые каждому пользователю редактора Word. Они находятся в инструментальной панели рабочего интерфейса программы (см. рис. 4.3).
Чтобы впоследствии применить обученный пользовательский эталон для распознавания другого документа, нужно выполнить соответствующие настройки (см. рис. 4.9) и выбрать его в редакторе эталонов (см. рис. 4.5).
Любой созданный пользователем эталон впоследствии можно отредактировать. Для этого в редакторе эталонов (см. рис. 4.5) нужно выделить его щелчком мыши и нажать кнопку Редактировать. В результате на экране откроется окно, изображенное на рис. 4.14.
Рис. 4.14. Редактирование эталона, режим «Изображения»
Данное окно имеет два представления: «Изображение» (см. рис. 4.14) и «Вид со свойствами» (см. рис. 4.15). Переключение между ними осуществляется с помощью соответствующих кнопок, расположенных внизу окна.
Рис. 4.15. Редактирование эталона, режим «Вид со свойствами»
И в первом, и во втором случае в окне представлен перечень аналогий, назначенных данному эталону в процессе обучения. В режиме «Изображения» эти аналогии можно только просматривать или удалить, а в режиме «Вид со свойствами» можно также редактировать их свойства путем установки или снятия соответствующих флажков. Отметим, что просматривать и редактировать свойства выбранных позиций можно также в окне (рис. 4.16), открываемом нажатием кнопки Свойства.
Рис. 4.16. Окно Свойства
В данном режиме можно выполнять те же действия, что и при обучении эталона: выбирать символ для замены непонятного или нестандартного изображения, а также применять к нему эффекты. Выполненные изменения вступают в силу после нажатия кнопки ОК.
Чтобы удалить ненужный элемент из эталона, выделите его щелчком мыши (это можно делать как в режиме «Изображения», так и «Вид со свойствами»), и нажмите кнопку Удалить. При этом программа выдаст дополнительный запрос на подтверждение данной операции.
ПРИМЕЧАНИЕОбратите внимание – добавлять новые символы в пользовательский эталон в режиме редактирования невозможно. Здесь вы можете лишь просматривать его содержимое и редактировать свойства имеющихся символов. Добавление же новых символов возможно только в процессе обучения эталона.Каждый пользовательский эталон может включать в себя до 1000 символов. При этом вы можете обучать эталон как символам, так и лигатурам (лигатура – сочетание двух или даже трех символов, которые неделимы из-за особенностей начертания и потому назначаются в виде комбинаций; работа с ними ведется так же, как и с отдельными символами). Но слишком увлекаться лигатурами не рекомендуется – может пострадать качество распознавания.Таким образом, с помощью пользовательских эталонов мы сможем распознать практически любой нестандартный или плохо читаемый документ. Однако этим дополнительные возможности программы по распознаванию сложных документов не исчерпываются – в частности, вы можете задействовать механизмы словарей и стилей, а также редактор языков. Доступ к этим возможностям осуществляется с помощью команд главного меню Сервис→Просмотр словарей, Сервис→Редактор стилей и Сервис→Редактор языков.
Программа Type PilotВ данном разделе мы познакомимся с программой, использование которой позволяет существенно ускорить набор текстов – Type Pilot. Она распространяется условно-бесплатно, ее демонстрационную версию можно скачать по адресу http://www.colorpilot.ru/typepilot.html.Смысл работы данной программы заключается в том, что она позволяет вставлять в документ слова или текстовые фрагменты на основании лишь нескольких первых введенных символов (это напоминает механизм автотекста, хорошо знакомый пользователям редактора Word). Например, можно сделать так, что фраза Добрый день, рады приветствовать Вас будет набрана уже после ввода символов Добр.Системные требования, предъявляемые программой Type Pilot к аппаратным ресурсам компьютера, достаточно скромны – РС-совместимый компьютер с процессором не ниже 486, операционная система Windows любой версии, начиная с Windows 95, и 200 Кб свободного дискового пространства. Программа работает с любым известным текстовым редактором.Возможности программы позволяют разместить в ее базе свыше 100000 шаблонных текстовых фрагментов, слов, электронных адресов, наборов символов и т. д., каждый из которых легко вставляется в нужное место документа. Для удобства работы все шаблонные фразы (текстовые фрагменты) можно разложить по тематическим папкам, которые пользователь может создавать самостоятельно.После установки программы ее значок располагается в правой части панели задач. По умолчанию программа помещается в автозагрузку; для удаления программы из автозагрузки нужно щелкнуть правой кнопкой мыши на значке программы и в открывшемся меню отключить пункт В автозагрузку.Интерфейс программы представлен на рис. 4.17.
Рис. 4.17. Программа Type Pilot
В левой части данного окна содержится перечень тематических папок, содержащих фразы, в правой – перечень фраз той папки, на которой установлен курсор в левой части окна. Для добавления новой папки нужно выполнить команду главного меню Папка→Новая папка либо нажать комбинацию клавиш Ctrl+Ins. В результате новая папка будет добавлена в перечень папок; имя папки следует ввести с клавиатуры. При необходимости папку можно переименовать с помощью команды главного меню Папка→Переименовать. Для удаления папки из списка нужно установить на нее курсор и выполнить команду Папка→Удалить (также для этого можно воспользоваться клавишей Delete).
- Учитесь быстро читать - Олег Андреев - Прочая научная литература
- Азбука бухгалтерского учета. Что надо знать для работы с бухгалтерскими программами: 1) Большинство видов хозяйственных операций 2) Типовые проводки на практических примерах - Алексей Виноградов - Прочая научная литература
- Superпамять. Интенсив-тренинг для развития памяти - Ольга Кинякина - Прочая научная литература
- Сообщество разума - Марвин Мински - Зарубежная образовательная литература / Прочая научная литература
- Эстетика - Виктор Бычков - Прочая научная литература
- Апельсиновый тренинг 18 – 2. Образ «Я». 18 игр, упражнений, заданий на самопознание - Михаил Кипнис - Прочая научная литература
- Сборник научно-практических статей III Международной научно-практической конференции «Актуальные проблемы предпринимательского и корпоративного права в России и за рубежом». РАНХиГС, юридический факультет им. М. М. Сперанского Института права и нацио... - Прочая научная литература
- Учимся говорить правильно за 20 минут в день - Елена Анищенкова - Прочая научная литература
- Графология: характер по почерку - Владимир Кравченко - Прочая научная литература
- Мастер текста - Александр Мазин - Прочая научная литература