Самоучитель «слепой» печати. Учимся быстро набирать тексты на компьютере
Шрифт:
После запуска программы на экране отображается окно, которое показано на рис. 4.1.
Рис. 4.1. Программа FineReader 11 Professional Edition
Чтобы начать сканирование и распознавание документов, подключите сканер к компьютеру, включите его и положите в него документ. После этого щелкните мышью на требуемой позиции в стартовом окне (см. рис. 4.1). Например, если вам нужно сохранить отсканированный документ в формате Word, выберите пункт Сканировать в Microsoft Word – в результате через некоторое время на экране отобразится окно Word, в котором будет представлен отсканированный и распознанный текст документа.
Чтобы просто запустить процесс сканирования, выберите в данном окне (см. рис. 4.1) пункт Сканировать или команду главного меню Файл->Сканировать страницы (эта команда вызывается также нажатием комбинации клавиш Ctrl+K). Через некоторое время отсканированный текст отобразится на экране.
Возможности программы предусматривают распознавание документов, предварительно сохраненных в файле изображения (gif, jpg и т. п.) или в файле pdf-формата. Для этого нужно выполнить команду главного меню Файл->Открыть PDF/Изображение (эта команда вызывается также нажатием комбинации клавиш Ctrl+O), после чего в открывшемся окне указать путь к требуемому файлу и нажать кнопку Открыть.
СОВЕТ Если вам необходимо распознать текст не на русском, а на каком-то другом языке, либо многоязычный документ – выберите соответствующее значение в раскрывающемся списке Языки документа. После этого отобразится окно, в котором будет показан ход процесса распознавания (рис. 4.2).Рис. 4.2. Распознавание документа
Через некоторое время это окно закроется автоматически, и на экране отобразится главный рабочий интерфейс Fine Reader (рис. 4.3).
Рис. 4.3. Рабочее окно программы
Этот интерфейс включает в себя четыре окна: это окна Страницы, Изображение, Текст, а также окно крупного плана, которое находится внизу. Вы можете самостоятельно управлять отображением каждого из этих окон с помощью соответствующих команд меню Вид.
В окне Изображение показано изображение либо PDF-документ, отсканированный и распознанный текст которого отображается в окне Текст. В окне Крупный план можно просмотреть крупный план документа (для этого используйте полосу прокрутки). Если текст распознался некорректно (например, некоторые символы не определились), то необходимую правку можно выполнить в окне Текст, после чего из этого же окна документ сохраняется в требуемом формате.
ПРИМЕЧАНИЕ Все неуверенно распознанные символы в окне Текст выделяются цветом, если с помощью команды Вид->Окно Изображение/Текст->Выделять неуверенно распознанные символы была включена соответствующая настройка. Подходящий формат документа выбирается из меню, доступ к которому осуществляется с помощью соответствующей кнопки инструментальной панели (рис. 4.4).Рис. 4.4. Выбор формата для сохранения распознанного документа
Отметим, что по умолчанию программа предлагает сохранять документ в формате Word.
Чтобы сохранить документ, нужно выбрать требуемый формат – в результате на экране открывается окно, в котором нужно указать путь для сохранения и имя файла.
Вот таким образом осуществляется сканирование, распознавание и сохранение несложных для распознавания документов в программе Fine Reader. Если же документ является сложным для распознавания, то следует задействовать дополнительные возможности программы, специально предназначенные для решения подобных проблем. С одним из таких механизмов мы познакомимся далее.
Применение пользовательсмких эталонов
В последней версии программы реализованы
Далеко не всегда процесс распознавания текстов проходит гладко. Особенно это касается документов, которые выполнены декоративным или другим нетрадиционным шрифтом, содержат специфические символы (например, в формулах) или просто плохого качества. В таких случаях Fine Reader сталкивается с затруднениями.
Однако в программе реализован механизм, который позволяет объяснить ей, как надо распознавать нестандартные или некачественные тексты. Для этого нужно создать и обучить специальный пользовательский эталон, в котором для каждого сомнительного или непонятного символа определяется его усредненное точечное изображение и название.
ВНИМАНИЕ Пользовательский эталон создается на начальном этапе распознавания документа, и в дальнейшем используется для распознавания основного объема текста. Созданный эталон можно сохранить и впоследствии использовать для работы с другими документами. Кроме этого, в программе имеются также встроенные эталоны. Далее перечислим несколько правил, которые следует учитывать при распознавании текстов с помощью пользовательских эталонов. • Созданные эталоны впоследствии можно применять для распознавания только тех документов, в которых разрешение, шрифт и его размер совпадают с документом, на основании которого данный эталон был создан. При несоблюдении этого правила результат распознавания может быть непредсказуемым. • Программа не различает некоторые символы и сопоставляет их с каким-то одним символом. Характерный пример – апострофы: правый (`) и левый (ґ) в программе не идентифицируются и ассоциируются с прямым апострофом ('). Поэтому в распознанном документе никогда не отобразится ни правый, ни левый апостроф: вместо них будет вставлен прямой, причем даже в том случае, когда в процессе обучения эталона были указаны именно они. • Применять пользовательские эталоны для распознавания имеет смысл лишь тогда, когда документ содержит декоративные или нестандартные символы, либо когда нужно распознать большое количество текста плохого качества. В других случаях это может оказаться нецелесообразно. • В некоторых случаях Fine Reader делает вывод о сопоставлении изображения тому или иному символу на основании общего анализа текста. В частности, так она может определить, какому символу сопоставить изображение «кружок» – нулю или букве «о», исходя из того, какие символы находятся поблизости (цифры или буквы). Чтобы войти в режим работы с эталонами, выполните в главном меню команду Сервис->Редактор эталонов либо нажмите комбинацию клавиш Ctrl+Shift+A. В результате на экране откроется окно, изображенное на рис. 4.5.Рис. 4.5. Редактор эталонов
В данном окне представлен перечень имеющихся в программе эталонов. С помощью кнопки Выбрать осуществляется выбор эталона для распознавания текущего документа, который соответствующим образом помечается в списке.
Чтобы добавить в программу новый эталон, нажмите кнопку Новый. В результате откроется окно, которое показано на рис. 4.6.
Рис. 4.6. Регистрация нового эталона
В данном окне нужно с клавиатуры ввести произвольное имя эталона и нажать кнопку ОК. После этого вновь созданный эталон отобразится в окне редактора (см. рис. 4.5).
С помощью кнопки Редактировать осуществляется переход в режим редактирования эталона. Отметим, что для новых эталонов это не имеет смысла: вначале нужно обучить эталон на основании какого-то документа, и лишь после этого его можно будет как-то изменять.
Если потребуется переименовать какой-то эталон, выделите его в списке щелчком мыши и нажмите кнопку Переименовать, после чего в открывшемся окне (см. рис. 4.6) введите требуемое имя и нажмите ОК.