FINEREADER
Программа FineReader фирмы ABBYY - пожалуй, наиболее распространенная OCR-программа1 на нашем рынке, включая, к сожалению, и пиратский. В свое время я по работе довольно активно пользовался третьей версией этой программы. Для первого издания этой книги поставил себе четвертую, для второго - пятую, к третьему изданию поспела шестая версия, а к четвертому уже седьмая, так что могу сравнивать. Вывод мой таков: программа становится от версии к версии все удобнее и надежнее. Но и размеры растут. FineReader 5.0 Pro занимал на диске от 35 МБ при минимальной установке (когда выбирается один язык для интерфейса и два для распознавания) до 140 МБ в максимальной (два языка для интерфейса и полтораста штук - для распознавания). Версия 6.0, в соответствии с тенденцией эпохи, занимает уже 170 МБ дискового пространства, а 7.0 - 185. Помимо 177 обычных языков (включая искусственные вроде эсперанто и еще трех, о которых я в жизни не слыхал) FineReader понимает также основные языки программирования, штрихкоды, простые химические формулы, причем умеет распознавать разноязычный текст. Имеет функцию обучения. Вполне успешно интегрируется с Microsoft Office всех версий (не только с Word, но и с Excel), а также с текстовыми редакторами не микрософтовского производства - Lotus WordPro, Corel Word Perfect, StarWriter. Может взаимодействовать также с переводчиком PROMT. Кроме того, отсканированный файл можно будет сразу отправить электронным письмом (правда, без рисунков, только текст) или загрузить в браузер в виде веб-страницы (тут уже - с рисунками). Начиная с шестой версии появилась редкая возможность открывать, распознавать и редактировать файлы формата Adobe PDF, сохранять отсканированные документы в этом формате. PDF - пока еще относительно редко используемый у нас, зато чрезвычайно распространенный на Западе формат для распространения полностью оформленных (а часто и защищенных от изменений) многостраничных документов. Для того чтобы иметь возможность просматривать PDF-файлы и отыскивать на них нужный фрагмент, требуется бесплатная утилита Adobe Reader (ранее называлась Adobe Acrobat Reader), а вот для редактирования... Отсканированная страница существует в программе в трех формах: • на левой узкой панели (панель Пакет) - в виде значка или эскиза; • на средней большой панели (Изображение) - в графическом виде; • и справа (панель Текст) - в виде распознанного текста. ... На самой нижней горизонтальной панели программа показывает увеличенное изображение того участка текста, который вы просматриваете в настоящий момент (панель Крупный план). Та часть страницы, которая в настоящий момент видна на панели крупного плана, будет обведена пунктирной рамкой на панели Изображение. Впрочем, укрупнить изображение можно на любой из панелей (кроме, конечно, Пакета) - обратите внимание на окошки с надписями 50% и 100% в левом нижнем углу каждой из панелей. Так что панелью Крупный план можно, в общем, и не пользоваться - взять мышкой верхнюю ее границу и задвинуть вниз. Так же можно поступить и с любой другой ненужной вам панелью - взять мышкой и куда-нибудь задвинуть. По комбинации Ctrl-Tab, мышкой и через меню Окна можно переходить с одной панели на другую. Стандартной виндоузовской комбинацией Ctrl-F4 закрываются сразу все панели, кроме пакетной. Но повторный щелчок по эскизику слева - и вы снова видите и рисунок, и текст, и крупный план. Если же вам надо именно удалить страницу из пакета - она, отсканирована, распознана и более не нужна, - выберите слева ее эскиз и нажмите клавишу Del. Поглядите, кстати, на сами эскизы в пакетной панели. Распознанный рисунок помечается в левом углу мелким значком в виде листика. Рисунок, сохраненный на диск, помечается также значком в виде дискетки. А увидев на эскизе значок с желтым треугольником и восклицательным знаком, вы сразу понимаете, что по данной страничке есть у FineReader'a какие-то замечания. Подведите курсор и во всплывающей подсказке узнаете, например, что при сканировании данного текста надо увеличить яркость, тогда и результат будет получше. Или при сканировании мелкого текста программа посоветует увеличить разрешение. Такого же рода замечания она дает и по ходу распознавания текста.