Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Работа с программой Fine Reader и порядок распознавания документов






Основные операции обработки бумажного документа в программе Fine Reader выполняются с помощью панели инструментов Scan& Read.

На панели инструментов программы находятся соответствующие кнопки “Сканировать “, “ Сегментировать “, “ Распознать “, “ Проверить “, “ Сохранить “. Можно выполнять указанные операции и через меню Scan& Read в строке команд.

Процесс обработки документа состоит из следующих шагов:

– канирование документа;

– сегментация документа;

– распознавание документа;

– редактирование и проверка результата;

– сохранение документа.

Первый этап работысканирование. На этом этапе используют сканер. Чтобы начать сканирование, нужно включить сканер, положить оригинал документа (обычно левой стороной вниз, если только вы не используете ручной сканер) и щелкнуть кнопку “Сканировать “ или в раскрывающемся списке подкоманд данной кнопки использовать пункт Сканировать (рисунок 2):

Рисунок 2 Вид кнопки “Сканировать”

 

Программа способна работать со сканером как непосредственно, так и через драйвер TWAIN. При непосредственном взаимодействии со сканером возможность сканирования цветных изображений не используется, так как предполагается, что текст в любом случае является одноцветным.

Программа использует для сканирования устройство, которое задано по умолчанию. Для того, чтобы выбрать такое устройство или изменить его настройку, нужно выбрать пункт Опции …в раскрывающемся списке кнопки “ Сканировать “ – откроется диалоговое окно Опции (рисунок 3).

Если к компьютеру подключено несколько сканеров или был подключен после установки программы Fine Reader 4.0, следует щелкнуть на кнопке Выбрать сканер. В этом случае проведет поиск подключенных к компьютеру сканеров и позволит выбрать нужный.

 

Рисунок 3 Вид диалогового окна Опции на вкладке Сканирование

 

Сам процесс сканирования происходит в автоматическом режиме. Если требуется обработать много страниц, то лучше сначала все их отсканировать, а затем приступать к распознаванию. Это связано с тем, что сканирование требует присутствия пользователя из-за необходимости управления сканером (например, для смены страниц), а процесс распознавания может происходить в автоматическом режиме.

Когда процесс сканирования завершается, появляется окно с изображением текста.

Второй этап работысегментация текста. Дело в том, что в бумажном документе, например на странице книги или журнала, текст не всегда располагается в фиксированном порядке. Он может размещаться в нескольких колонках (столбцах), содержать иллюстрации (и подписи к ним), другие элементы форматирования. Дополнительные врезки и данные, представленные в таблицах, также могут запутать естественный порядок текста. Поэтому, прежде чем включать текст в документ, его разбивают на блоки, содержащие цельные фрагменты. Блоки распознают последовательно. Полученный текст включается в документ в порядке нумерации блоков.

Сегментация – разбиение документа на блоки.

Ручную установку блоков (рамка с помощью левой кнопки мыши) можно применить, если нужно распознать только часть текста.

Для создания блока непрямоугольной формы или для изменения последовательности блоков используют кнопки, выведенные на панели (рисунок 5) инструментов «Инструменты»:

Рисунок 5 Вид кнопок на панели «Инструменты»

 

Все кнопки этой панели используются именно на этапе сегментации и позволяют:

- создать блок (кнопка 1 – Создать блок);

- объединить два блока в один (кнопка 2 – Добавить часть блока);

- удалить фрагмент блока (кнопка 3 – Удалить часть блока);

- изменить положение блоков (кнопка 4 – Переместить блоки);

- изменить порядок нумерации блоков (кнопка 5 – Перенумеровать блоки);

- удалить блоки (кнопка 6 – Удалить блок);

- изменить разбиение таблицы на ячейки (кнопки 7).

Разные типы блоков обрабатываются программой по-разному. Программа Fine Reader поддерживает следующие типы блоков (рисунок 6).

Рисунок 6 Вид контекстно-зависимого меню при работе с блоками

 

- текстовый (Текст) – на этапе распознавания преобразуется в текст;

- табличный (Таблица) – представляет собой набор ячеек, каждая из которых преобразуется в текст по отдельности;

- изображение (Картинка) – включается в документ без изменений как графическая иллюстрация, если формат сохранения преобразованного документа допускает вставные объекты;

- лишний (Нераспознаваемый) – игнорируется;

- содержащий штрих-код (Штрих-код) – распознается как штрих-код.

Для автоматической сегментации текста используют кнопку “Сегментировать” или ее раскрывающийся список подкоманд (рисунок 7):

Рисунок 7 Вид кнопки “Сегментировать”

 

При автоматической сегментации определение границ блока определяется автоматически. При этом учитываются поля документа, просветы между колонками, рамки.

Третий этап работы программы – непосредственно распознавание. Этот этап обычно не требует вмешательства пользователя, за исключением тех случаев, когда распознавание сопровождается «обучением».

Для большинства случаев сразу нужно нажать на кнопку инструмента “Распознать “ и подтвердить автоматическое определение блоков (рисунок 8):

 

Рисунок 8 Вид кнопки “Распознать “

Процесс распознавания будет " иллюстрироваться" закраской участков текста.

Точность распознавания FineReader около 92- 97 %, так как при печати книг и газет на бумаге иногда не прилипает или осыпается краска. Это будет хорошо видно в окне “Крупный план” с увеличенным масштабом.

Результаты распознавания будут отражены в окне “ Текст ”.

На четвертом этапе, средствами программы в полученном тексте, можно провести проверку грамматики с помощью соответствующей кнопки “Проверить” на панели инструментов или пунктом Проверить из раскрывающегося списка подкоманд (рисунок9):

 

Рисунок 9 Вид кнопки “Проверить”

 

В результате появится следующее окно диалога (рисунок 10):

Рисунок 10 Вид окна диалога проверка орфографии

 

Распознанный текст отображается в отдельном окне “ Текст ”, в виде форматированного текстового документа. Он «теряет связь» с исходным изображением и может редактироваться и форматироваться независимого от него. Программа выделяет цветом те символы, которые она рассматривает как неоднозначно опознанные. Это упрощает поиск ошибок.

Пятый этап: по щелчку на кнопке “Сохранить“ на панели инструментов Scan& Read (рисунок 11) запускается Мастер сохранения результатов (рисунок 12). Он позволяет сохранить распознанный текст или передать его в другую программу (например, MS Word) с помощью выбора соответствующего пункта из раскрывающегося списка подкоманд:

 

Рисунок 11 Вид кнопки “Сохранить“

 

 

Рисунок 12 Вид окна Мастера сохранения результатов

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.