Реферат: Робота з програмою FineReader

ЗМІСТВСТУПРОЗДІЛ І. ПОСТАНОВКА ЗАДАЧ1.1. ВХІДНА ІНФОРМАЦІЯРОЗДІЛ ІІ. ІНСТРУКЦІЯ ПОЕКСПЛУАТАЦІЇ2.1. ЗАПУСК ПРОГРАМИ, ВВЕДЕННЯПОЧАТКОВИХ ДАНИХ2.2. РОБОТА З ПРОГРАМОЮ2.3. ДОДАТКОВА ІНФОРМАЦІЯВИСНОВКИСПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ
ВСТУП

Стрімкий розвиток комп'ютерної техніки і її різноманітногопрограмного забезпечення — це одна з характерних прикмет сучасного періодурозвитку суспільства. Технологи, основним компонентом яких є комп'ютер,проникають практично в усі сфери людської діяльності. Те, що ще недавновважалось фантастикою, тепер, завдяки науково-технічному прогресу, особливопрогресу в області комп'ютерних технологій, стало реальністю.

Комп'ютерні технології застосовують у видавництвах і великихбібліо­теках, у парламентах і міністерствах, у банках і на складах, у системахзв'язку і системах управління транспортом, у податкових інспекціях і у сферірозваг тощо. Тепер практично неможливо уявити сучасний офіс без повсякденного іширокого застосування комп'ютерних технологій. Комп'ютер став неодмінниматрибутом робочого місця працівників багатьох професій. У цих умовах продовжуєзростати попит на комп'ютерних спеціалістів, особливо на молодих спеціалістіввисокої кваліфікації. Великою популярністю користуються спеціалісти зкомп'ютерної верстки та макетування, комп'ю­терні художники і дизайнери,спеціалісти з банківських та бухгалтерських комп'ютерних систем, спеціалісти зкомп'ютерних мереж та ряд інших.

Досить актуальними на сьогоднішній час стали системи оптичногорозпізнавання символів ( OCR ).

Системи оптичного розпізнавання символів(Optical Character Recognition) призначені для автоматичного введеннядрукованих документів в комп'ютер. Однією із таких систем є FineReader.

FineReader — омніфонтова системаоптичного розпізнавання текстів. Це означає, що вона дозволяє розпізнаватитексти, набрані практично будь-якими шрифтами, без попереднього навчання.Особливістю програми FineReader є висока точність розпізнавання і малачутливість до дефектів друку, що досягається завдяки застосуванню технології«цілісного цілеспрямованого адаптивного розпізнавання».

На сьогоднішній день існує багато версійпрограми FineReader, однак найбільш популярною і досконалою є програма версіїFineReader 5.0, тому в даній дипломній роботі ми детальніше зупинимося саме наній.


РОЗДІЛІ. ПОСТАНОВКА ЗАДАЧ

 

1.1. Вхідна інформаціяПроцес введеннядокументу в комп'ютер можна розділити на два етапи:

1.        Сканування. На першому етапі сканер відіграє роль «ока» комп'ютера:«переглядає» зображення і передає його комп'ютеру. При цьому отриманезображення є не чим іншим, як набором чорних, білих або кольорових крапок,картинкою, яку неможливо відредагувати в жодному текстовому редакторі.

2.        Розпізнавання. Обробка зображення OCR-системою.

Обробка зображення системою FineReaderмістить у собі аналіз графічного зображення, переданого сканером, ірозпізнавання кожного символу. Процеси аналізу макета сторінки (визначенняобластей розпізнавання, таблиць, зображень, виділення в тексті рядків і окремихсимволів) і розпізнавання зображення тісно пов'язані між собою: алгоритм пошукублоків використовує інформацію про розпізнаний текст для більш точного аналізусторінки.

Як уже згадувалося, розпізнавання зображенняздійснюється на основі технології «цілісного цілеспрямованого адаптивногорозпізнавання».

·          Цілісність — об'єкт описується як ціле за допомогоюзначимих елементів і відношень між ними.

·          Цілеспрямованість — розпізнавання будується як процес висуванняі цілеспрямованої перевірки гіпотез.

·          Адаптивність — здатність OCR-системи до самонавчання.

Відповідно до цих трьох принципівсистема спочатку висуває гіпотезу про об'єкт розпізнавання (символ, частинусимволу або декілька склеєних символів), а потім підтверджує або спростовує її,намагаючись послідовно знайти всі структурні елементи і відношення, що їхпов'язують. У кожному структурному елементі виділяються частини, значимі длялюдського сприйняття, — відрізки, дуги, кільця і крапки. Виходячи з принципуадаптивності, програма самостійно «налагоджується», використовуючи позитивнийдосвід, отриманий на перших впевнено розпізнаних символах. Цілеспрямованийпошук і облік контексту дозволяють розпізнавати розірвані і перекрученізображення, роблячи систему стійкою до можливих дефектів друку.

Наслідком роботи у вікні FineReaderз'явиться розпізнаний текст, який можна редагувати і записати у найзручнішомуформаті.

Нові можливості програми FineReader 5.0.

Робота з зображеннями

·          Новий режим відображеннясторінок пакета Піктограми, у якому сторінки пакета представляються своїмисильно зменшеними зображеннями.

Сканування

·          Можливість скануваннярозвороту книги: обидві сторінки розкритої книги скануються одночасно, алеобробляються окремо. Зображення, що містить парні сторінки, записується в двірізні сторінки пакета.

Аналіз макету сторінки

·          У програму доданаоб'єднана процедура аналізу макета сторінки і розпізнавання. Тепер алгоритмпошуку блоків використовує інформацію про розпізнаний текст для більш точногоаналізу макету сторінки. Нові алгоритми аналізу використовуються автоматичнопри запуску розпізнавання на сторінці без блоків, тобто аналіз макета ірозпізнавання проводяться за один крок. Старий алгоритм аналізу сторінки, що невикористовує розпізнавання, як і раніше доступний (меню Процес>Аналізмакету сторінки).

·          Підтримка розпізнавання«вбудованих» зображень: можливо визначити блок «зображення»усередині текстового або табличного блоку.

РозпізнаванняІснує дваваріанти поставки ABBYY FineReader: EU — 121 мова розпізнавання (латиниця та грецькі); CyrillicPlus — 176 мов розпізнавання(латиниця, грецька та кирилиця). Усі мови розпізнавання поділяються на основнімови, додаткові та

штучні мови. Основна група утворена змов зі словниковою підтримкою. Для цих мов у програмі FineReader підтриманаперевірка розпізнаного тексту (знаходження невпевнено розпізнаних слів і слів зорфографічними помилками).

·          Розпізнавання мовпрограмування (Basic, Cobol, Fortran, Java, C++, Pascal).

·          Розпізнавання підрядковихсимволів (наприклад, H2O).

·          Розпізнаваннявертикального тексту.

·          Коректна передача кольорутексту.

Збереження і редагування

·          Можливість збереженнярозпізнаного тексту у форматі HTML з повним збереженням оформлення сторінки.

·          Можливість збереження розпізнаноготексту у форматі PDF із збереженням повного оформлення документа.

·          Збереження кольору текступри збереженні розпізнаного тексту в RTF, PDF і HTML форматах.

·          Підтримка Unicodeкодування при збереженні розпізнаного тексту в RTF, DOC, XLS, HTML, TXT і CSVформатах.

FineReader працює зі сканерами через TWAIN-інтерфейс.Це єдиний міжнародний стандарт, введений у 1992 році для уніфікації взаємодіїпристроїв для введення зображень у комп'ютер (наприклад, сканеру) із зовнішнімипрограмами.

Якість розпізнавання багато в чомузалежить від того, наскільки гарне зображення отримано при скануванні. Якістьзображення регулюється задаванням основних параметрів сканування: типузображення, роздільної здатності та яскравості.

Основними параметрами сканування є:

·          Тип зображення — сірий (256 градацій).

Сканування в сірому є оптимальнимрежимом для системи розпізнавання. У випадку сканування в сірому режиміздійснюється автоматичний підбір яскравості. Чорно-білий тип зображеннязабезпечує більш високу швидкість сканування, але при цьому губиться частинаінформації про літери, що може призвести до погіршення якості розпізнавання надокументах середньої і низької якості друку. Якщо необхідно, щоб кольоровіелементи (картинки, колір літер і фону), що містяться в документі, булипередані в електронний документ зі збереженням кольору, необхідно вибрати кольоровийтип зображення. В інших випадках слід використовувати сірий типзображення.

·          Роздільна здатність – найчастіше слід використовувати 300dpi ( точок на дюйм ) для звичайних текстів (розмір шрифту 10 і більшпунктів) і 400-600 dpi для текстів, набраних дрібним шрифтом (9 і меншепунктів).

·          Яскравість — у більшості випадків підходить середнєзначення яскравості — 50%. На деяких документах при скануванні у чорно-біломурежимі може знадобитися додаткове регулювання параметрів яскравості.


РОЗДІЛІІ. ІНСТРУКЦІЯ ПО ЕКСПЛУАТАЦІЇ

 

2.1. Запуск програми, введення початковихданих

Перш ніж приступити до роботи зпрограмою FineReader слід встановити її на комп’ютері. Для цього необхіднооптичний диск із дистрибутивом програми вставити у пристрій читання дисків(CDROM). Натиснути кнопку Пуск на Панели Задач і вибрати пункт Настройка/Панельуправления. Двічі натиснути на іконку Установка и удаление программ.Вибрати закладку Установка и удаление і натиснути кнопку Установить...Після цього потрібно діяти за вказівками програми встановлення.

Після того, як програмавстановлення перевірить систему, слід набрати своє ім'я і вказати, кудипотрібно встановити ABBYY FineReader. Програма встановлення відобразитьдекілька параметрів встановлення. Щоб вибрати один з варіантів встановлення,необхідно натисніть відповідну кнопку ( мал. 1).

/>

Повна — встановлюються усі компоненти дистрибутиву, у томучислі всі мови розпізнавання

Мінімальна (рекомендується) — програма встановлюється умінімальній конфігурації: Мова інтерфейсу (одна) — обрана під час встановлення;мови розпізнавання — англійська + мова, яку обрано під час встановлення.

 

Встановлення компонентдистрибутиву на вибір — ззапропонованого набору компонентів, що входять у дистрибутив, можна вибратитільки ті, які потрібні (у тому числі доступні мови розпізнавання).

Мал. 1

Після встановлення програминеобхідно її запустити. Щоб запустити програму потрібно вибрати пункт ABBYYFineReader 5.0 Pro (Office) у меню Пуск/Програми/ABBYY FineReader 5.0.

Підчас першого запуску FineReaderавтоматично створить і відобразить на екрані стандартний пакет, у якомуміститься файл з зображенням demo.tif. Робота з документами у програміFineReader виконується у пакеті. Пакет — це каталог на диску, у якомузберігаються зображення сторінок та робочі файли програми. Кожне новезображення зберігається як окрема сторінка пакету.

Після запуску FineReader на екраніпоявиться головне вікно програми ( Мал. 2).

/>

/>

Вгорі Головного вікна FineReaderзнаходиться головне меню системи, під ним — панелі інструментів. У програмі єчотири панелі інструментів: Стандартна, Форматування, Зображення таScan&Read.

Включити або виключити відображенняпанелей інструментів на екрані можна за допомогою меню Вигляд (пункт Панеліінструментів) або за допомогою контекстного меню. Щоб відкрити контекстнеменю, слід клацнути правою кнопкою миші на одній з панелей інструментів.Панелі, що у поточний момент відображаються на екрані, будуть відмічені у менюгалочкою.

Увесь простір Головного вікназаймають, по мірі того як вони з'являються, робочі вікна системи: Пакет,Зображення, Крупний план та Текст. Стандартний режимвідображення у вікні Крупний план — чорно-біле зображення, незалежно відтого яке саме зображення (кольорове, сіре чи чорно-біле) було відправлене насканування. Якщо робота здійснюється з кольоровим зображенням і необхідно, щобу вікні Крупний план зображення відображалось також у кольоровомурежимі, то слід зняти позначку вибору з пункту Чорно-біла палітра у вікніКрупний план, що у групі Вікно Зображення, яка на закладці Вигляд(меню Сервіс>Параметри) ( Мал. 3 ).

Є можливість також змінити розташуваннявікон на екрані, для цього

в меню Вигляд слід вибратиодин з пунктів: Вікно Пакет>...; Вікна Зображення та Текст>…або Вікно Крупний план>…

Комбінації клавіш для роботи звікнами

·          />Для того, щоб переключатись між вікнами, натиснути CTRL+TAB.

·          Для того, щоб активізувативікно Пакет, натиснутиAlt+1.

·          Для того, щоб активізувативікно Зображення, натиснути Alt+2.

·          Для того, щоб активізувативікно Текст, натиснути Alt+3.

Як уже було сказано вище, у системіFineReader є чотири Панелі інструментів: Стандартна, Зображення, Оформленняі головна панель програми Scan&Read. Кнопки, що на панеляхінструментів — найзручніший спосіб доступу до операцій системи. Ті ж операціїможна виконувати з меню програми чи за допомогою гарячих клавіш. Якщо необхіднодовідатися про призначення тієї чи іншої кнопки на панелі інструментів,потрібно підвести до кнопки курсор миші. Під кнопкою з'явиться докладнеповідомлення про її призначення.

/>
 

Кнопки на головнійпанелі програми Scan&Read ( мал. 4 ) пов'язані з базовимиопераціями системи: Сканування, Розпізнавання, Перевірка іЗбереження результатів розпізнавання. Цифри на кнопках вказують, у якомупорядку потрібно виконати дії, щоб одержати електронну версію паперовогодокументу. Кожну з цих дій можна провести окремо чи об'єднати в одну,натиснувши на кнопку Scan&Read. Вона дозволяє провести повний циклобробки тексту автоматично. Кожна з кнопок має кілька режимів роботи.Натиснувши на стрілку праворуч від кнопки, у локальному меню, яке відкрилося, можнавибрати один з них, при цьому "інформація" про це відіб'ється наіконці кнопки. Для того, щоб повторити ту ж операцію для іншого зображення, доситьповторно натиснути на кнопку.


Назва кнопки Режими роботи

Scan&Read
/>

Сканувати і розпізнати — запускає сканування і розпізнавання документа

Сканувати і розпізнати кілька сторінок — сканує і розпізнає декілька сторінок у циклі.

Відкрити і розпізнати — дозволяє відкрити і розпізнати зображення, вибрані в діалоговому вікні Відкрити (Open).

Маг Scan&Read — запускає спеціальний режим сканування і розпізнавання, під час якого система контролює дії користувача і підказує йому, що треба робити, щоб одержати той чи інший результат

1-сканувати
/>

Відкрити зображення — додає зображення в пакет, при цьому копія зображення зберігається в папці пакета
 Сканувати зображення — сканує зображення
 Сканувати декілька сторінок — сканує зображення у циклі. Щоб зупинити сканування, у меню Файл потрібно вибрати пункт Зупинити сканування
 Параметри
— відкриває закладку Сканування/Зображення діалогового вікна Параметри, на якій можна задати параметри сканування і попередньої обробки документу

2-розпізнати
/>

Розпізнати — розпізнає відкриту сторінку пакета

Розпізнати всі сторінки — розпізнає всі нерозпізнані сторінки пакета

Параметри — відкриває закладку Розпізнавання діалогового вікна Параметри, на якій можна задати параметри розпізнавання документу

3-перевірити

/>

Перевірити правопис - дозволяє знайти в тексті слова, що містять невпевнено розпізнані символи, і неправильно написані слова

Параметри — відкриває закладку Перевірка діалогового вікна Параметри, на якій можна задати параметри перевірки документу

4-зберегти
/>

Маг збереження результатів — відкриває діалогове вікно Маг збереження результатів, у якому можна вибрати програму для збереження і задати параметри збереження

Записати текст у файл — записує розпізнаний текст у файл на диск

Передати сторінки в — прямо передає розпізнаний текст до обраної програми без збереження його на диск. При передачі розпізнаного тексту з декількох сторінок пакету спочатку потрібно виділити їх у вікні Пакет.

Передати всі сторінки в — передає всі розпізнані сторінки до обраної програми без збереження їх на диск

Параметри — відкриває закладку Оформлення діалогового вікна Параметри, на якій можна задати параметри збереження документу

На панелі Оформлення ( мал. 5) знаходяться кнопки, які дозволяють змінити оформлення тексту

/>

Мал. 5

Панель Зображення ( мал. 6 )містить кнопки, що дозволяють робити аналіз макету сторінки (наприклад,створити і відредагувати блоки), а також кнопки, що дозволяютьзбільшити/зменшити масштаб зображення, відредагувати зображення (наприклад,стерти непотрібні ділянки зображення такі, як підписи або великі ділянкисміття).

/>Напанелі Стандартна ( мал. 7 )знаходяться кнопки, щокерують роботою з файлами і зображенням (скасування і повтор дії, переміщеннясторінками пакету, очищення і поворот зображення), а також список моврозпізнавання

/>

Мал. 7.

Вигляд вікна програми FineReader,точніше кількість кнопок на панелях інструментів Зображення, Стандартнаі Оформлення залежить від роздільної здатності екрану комп'ютеру. Щобпобачити всі кнопки, згадані вище, потрібно змінити роздільну здатність екрануна більш високу. Оскільки кнопки реалізують лише частину доступних у програміFineReader команд і дублюються параметрами меню, відсутність декількох кнопокна панелях не обмежує функціональність програми.

Перш ніж приступити до роботи з програмою FineReaderнеобхідно ввести (просканувати) деяку текстову інформацію. Для цього потрібно:

1.        увімкнути сканер (якщо вінмає окреме від комп'ютера джерело живлення).
Слід зазначити, що багато моделей сканера необхідно вмикати до вмиканнякомп'ютера.

2.        Увімкнути комп'ютер ізапустити FineReader (Пуск/Програми/ABBYY FineReader 5.0). Відкриєтьсяголовне вікно програми FineReader.

3.        Вставити у сканерсторінку, яку потрібно розпізнати.

4.        Натиснути на стрілкуправоруч від кнопки Scan&Read, в локальному меню виберати пункт МагScan&Read.

Після сканування з'явиться вікно Зображення,що містить «фотографію» сторінки. Потім програма запропонуєвстановити параметри розпізнавання і почне розпізнавання зображення, одночасноаналізуючи його. Оброблені ділянки зображення зафарбовуються голубим кольором.

Результат розпізнавання можна побачити увікні Текст. У цьому ж вікні можна перевірити і відредагуватирозпізнаний текст. Діючи далі за вказівками Мага Scan&Read, можнаабо передати розпізнаний текст до обраної програми чи записати його на диск,або продовжити обробку наступних зображень.

 2.2. Робота з програмою

 

Процес роботи з програмою FineReaderскладається з чотирьох етапів: сканування, розпізнавання, перевірка ізбереження результатів розпізнавання.

1. Сканування

FineReader працює зі сканерами черезTWAIN-інтерфейс. Це єдиний міжнародний стандарт, введений у 1992 році дляуніфікації взаємодії пристроїв для введення зображень у комп'ютер (наприклад,сканеру) із зовнішніми програмами. При цьому можливо два варіанти взаємодіїпрограми зі сканерами через TWAIN-драйвер:

·          через інтерфейсFineReader: у цьому випадкудля задавання параметрів сканування використовується діалогове вікно програмиFineReaderПараметри сканування;

·          через інтерфейсTWAIN-драйвера сканера: длязадавання параметрів сканування використовується діалогове вікно TWAIN-драйверасканеру. У цьому режимі, як правило, доступна функція попереднього переглядузображення (preview), яка дозволяє точно задати розміри області, що сканується,підібрати яскравість, одразу контролюючи результати цих змін. Нажаль, діалогTWAIN-драйвера сканера в кожного сканера виглядає по-своєму, у більшостівипадків усі написи англійською мовою. Вигляд цього вікна і змістпараметрів описаний у документації, яка є у комплекті до сканеру.

У режимі Використовуватиінтерфейс FineReader доступні такі параметри, як можливість сканування вциклі на сканерах без автоподавача, збереження параметрів сканування вокремий файл Шаблон пакета (*.fbt) і можливість використання цихпараметрів для інших пакетів.

 По потребі можна легкопереключатися між цими режимами, для цього на закладці Сканування/Зображеннядіалогового вікна Параметри (меню Сервіс>Параметри)потрібно вибрати один з пунктів: Використовувати інтерфейс TWAIN-драйвера чиВикористовувати інтерфейс FineReader.

Щоб запуститисканування необхідно:

/>Натиснути кнопку 1-скануватичи в меню Файл вибрати пункт Сканувати. Через деякий час у Головномувікні програми FineReader з'явиться вікно Зображення з«фотографією» вставленого листка.

Якщо потрібно відскануватидекілька сторінок, то слід натиснути стрілку праворуч від кнопки 1-сканувати і в локальному меню вибрати пункт Скануватидекілька сторінок.

У випадку, якщо сканування не почалосяодразу, відкриється вбудований TWAIN-інтерфейс сканера або відкриється діалогПараметри сканування ( тут слід задати усі режими сканування ).

/>Якщонеобхідно одразу запустити розпізнавання відсканованих сторінок, то слідскористатися параметром Сканувати і розпізнати чи Сканувати ірозпізнати декілька сторінок. У цьому випадку слід натиснути стрілкуправоруч від кнопки Scan&Read і в локальному меню вибрати один зпунктів: Сканувати і розпізнати чиСканувати і розпізнати декількасторінок.

FineReader відсканує і розпізнаєзображення. У Головному вікні програми з'являться вікно Зображенняз «фотографією» уставленого листа і вікно Текст з результатомрозпізнавання. Розпізнаний текст можна передати до зовнішніх редакторів ізаписати у підтримуваних форматах.

Якість розпізнавання багато в чомузалежить від того, наскільки гарне зображення отримано при скануванні. Якістьзображення регулюється задаванням основних параметрів сканування: типу зображення,роздільної здатності та яскравості.

Щоб задатипараметри сканування необхідно:

·          При скануванні через TWAINз використанням інтерфейсу FineReader: у меню Сервіс слід вибратипункт Параметри сканування і в діалоговому вікні Параметри сканування задатипотрібні параметри.

·          При скануванні через TWAINз використанням інтерфейсу TWAIN-драйвера сканеру для задаванняпараметрів сканування використовується діалогове вікно сканеру, щовідкривається автоматично при натисканні на кнопку 1-сканувати. Параметридля сканування можуть називатися по-різному, у залежності від моделі сканеру.Наприклад, яскравість може називатися brightness, threshold, зображуватися«сонечком» чи чорно-білим кружком. Зміст параметрів описаний удокументації, яка є у комплекті до сканеру.

Для зручності сканування великоїкількості сторінок у програмі FineReader передбачено спеціальний режимсканування: Сканувати декілька сторінок. Він дозволяє відскануватидекілька сторінок у циклі. При цьому:

·          при скануванні через TWAINз використанням інтерфейсу FineReader по закінченні сканування сторінкисканер автоматично починає сканування наступної;

·          при скануванні через TWAINз використанням інтерфейсу TWAIN-драйвера сканеру Twain-діалог сканеруне закривається після закінчення сканування першої сторінки. Тут можна покластинаступну сторінку в сканер і відсканувати її і т.д.

2. Розпізнавання    

Перед запуском розпізнавання потрібно перевіритизадані параметри: мову розпізнавання, тип друку тексту, що розпізнається і типсторінки.

У програмі FineReader можна:

1.        Розпізнати блок або кількаблоків, виділених на зображенні.

2.        Розпізнати відкритусторінку або всі сторінки, виділені у вікні Пакет.

3.        Розпізнати всінерозпізнані сторінки пакета.

4.        Розпізнати всі сторінки уфоновому режимі. У цьому режимі можливо розпізнавання з одночасним редагуваннямуже розпізнаних сторінок.

5.        Розпізнати сторінки врежимі розпізнавання з навчанням. Даний режим використовується в основному длярозпізнавання текстів, що використовують декоративні шрифти, або розпізнаваннявеликого обсягу (більш 100 сторінок) документів поганої якості друку

Щоб запуститирозпізнавання потрібно натиснути кнопку 2 — розпізнати на панелі Scan&Read або у меню Процес вибрати потрібний пункт:

-         Розпізнати — щоб розпізнати відкриту сторінку або усі сторінки, виділені у вікніПакет;

-         Розпізнати усі — щоброзпізнати всі нерозпізнані сторінки пакету;

-         Розпізнати Блок — щоб розпізнати блок або кілька блоків, виділених на зображенні;

-         Розпочати фонове розпізнавання — щоб розпочати розпізнавання у фоновому режимі.

/>Кнопка2-Розпізнати запускає розпізнавання відкритого зображення. Щоб змінитирежим кнопки, слід натиснути на стрілку праворуч від неї і з меню, якевідкриється, вибрати потрібний пункт.

/>Передрозпізнаванням важливо правильно вибрати мову розпізнавання. FineReaderпідтримує розпізнавання як одномовних, так і багатомовних (наприклад,англійсько-українських) документів. Щоб задати мову тексту, що розпізнається,потрібно вибрати відповідний рядок у списку на панелі Розпізнавання (мал. 8. ).

Якщо потрібно розпізнати документ,написаний кількома мовами, то у списку мов на панелі Стандартна слідвибрати пункт Вибір декількох мов… У діалоговому вікні Мова тексту,що розпізнається вказати кілька мов. Для цього потрібно відзначте пункти звідповідними назвами мов.

3. Перевірка розпізнаного тексту

Невпевнено розпізнані символи іслова, яких немає в словнику, виділяються різними кольорами. Стандартно длявиділення невпевнено розпізнаних символів використовується голубий, для слів,що не знайдені в словниках – рожевий колір. Змінити ці кольори можна назакладці Вигляд (меню Сервіс>Параметри) у полі Елемент, вибравшипункт Невпевнено розпізнаний символ (Слово, що не знайдене всловниках) і в полі Колір - колір підсвічування.

Щоб перевірити результатирозпізнавання потрібно:

1.        Натиснути кнопку 3-перевіритина панелі Scan&Read (або вибрати пункт Перевірка у меню Сервіс).

-        Перевірка дозволяє знайти утексті слова, що містять невпевнено розпізнані символи, слова, що не знайдені всловниках, а також слова з орфографічними помилками.

Клавіатурна команда: F7

2.        Відкриється діалоговевікно Перевірка ( мал. 9) .

3.        У діалоговому вікні Перевіркатри частини. Верхня частина — аналог вікна «Крупний план» програми FineReader,у ньому показано зображення слова з можливою помилкою. Середня частина показуєсаме слово з можливою помилкою, у рядку над цим вікном виводиться назва типупомилки. У нижній частині, Варіанти замін, пропонуються варіанти заміницього слова (якщо такі />існують). Для варіантів використовується словник,зазначений у полі Мова словника. Тут можна використовувати будь-якийсловник із запропонованого списку.

Працюючи з діалоговим вікном Перевіркакористувач має наступні можливості:

-         Натиснути кнопку Пропустити,щоб залишити слово, як воно є.

-         Натиснути кнопку Пропуститивсі, щоб залишити всі такі слова в розпізнаному тексті, як вони є.

-         Вибрати варіант для заміниі натисніть кнопку Замінити або Замінити всі, щоб замінитипоточне слово або всі такі слова в тексті. Якщо серед слів, які є у Варіантахзамін немає правильного варіанту для заміни слова, можна відредагувати йогов середній частині діалогового вікна і натиснути кнопку Підтвердити, щобзамінити поточне слово.

-         Натиснути Додати...,щоб додати слово в словник. У цьому випадку при подальшій перевірці орфографії,якщо це слово (або одна з його форм) зустрінеться в тексті, воно не будевважатися помилковим

-         Натиснути Параметри...,щоб задати параметри перевірки розпізнаного тексту

-         Натиснути Закрити,щоб закрити діалогове вікно.

4. Збереження результатіврозпізнавання

Результати розпізнавання можна записатиу файл, передати до зовнішньої програми, не записуючи на диск, скопіювати убуфер обміну чи відправити електронною поштою. Зберегти можна усі сторінки аботільки обрані.

Кнопка 4 — зберегти дозволяє передати результати розпізнавання у обрану програму чизаписати їх у файл. Зовнішній вигляд іконки міняється в залежностівід обраного режиму збереження; підпис Зберегти міняється на назвуобраної програми. Натиснувши на кнопку 4 –зберегти, відкривається діалогове вікно Маг збереження результатів (мал. 10 ).

У полі Де зберегти результатможна вказати відповідну програму, у яку буде передано розпізнаний текст, можнаскопіювати текст у буфер обміну або відіслати електронно поштою.

Поле Оформлення дозволяє задати:

-         Повністю зберігатиоформлення документа — зберігається повне оформлення документа: розбивка на абзаци, вигляд і розміршрифту, колонки, напрямок тексту, колір букв і фон тексту. Зберігаєтьсяструктура таблиць.

-         Зберігати тільки вигляді розмір шрифтів — зберігається структура таблиць, розбивка на абзаци, вигляд і розмір шрифту.

-         Не зберігати оформлення — у цьому випадку зберігається розбивка наабзаци і структура таблиць.

ПолеЗберігати/не зберігатизображення дозволяє зберегти зображення в розпізнаному тексті. Цей параметрдоступний при збереженні у формати RTF, DOC чи HTML.

ПолеЗберегти всі чи тільки виділені сторінки дозволяєзберегти всі сторінки пакета чи тільки виділені. При збереженні або передачічастини сторінок, спочатку потрібно виділити їх у вікні Пакет. 2.3. Додаткова інформаціяДля нормальної роботи зпрограмою FineReader необхідно:

1.        ПК із процесором Pentium133 або більш потужним.

2.        Операційна системаMicrosoft Windows 2000, Windows NT Workstation 4.0 з пакетом поновлення 3 (SP3)або вище, Windows 95/98 (для роботи з українським інтерфейсом потрібна версіяWindows, яка підтримує кирилицю).

3.        32 Мб оперативної пам'яті,плюс 16 Мб для кожного додаткового процесора (у багатопроцесорних системах).

4.        Вільне місце на жорсткомудиску: 40 Мб для мінімального встановлення, 50 Мб для роботи системи.

5.        Microsoft InternetExplorer 3.02 або пізніша версія.

6.        100% Twain-суміснийсканер, цифрова камера або факс-модем.

7.        Монітор VGA або монітор збільш високою роздільною здатністю.

8.        Дисковід длякомпакт-дисків і дисковід 3,5"

9.        Мишка або іншийаналогічний пристрій.

FineReader зберігаєрезультати розпізнавання в наступних форматах:

·          Microsoft Word Document(*.DOC)

·          Rich Text Format (*.RTF)

·          Adobe Acrobat Format(*.PDF)

·          HTML

·          Comma Separated ValuesFile (*.CSV)

·          Простий текст (*.TXT).FineReader підтримує різні кодові сторінки (Windows, DOS, Mac, ISO) і кодуванняUnicode.

·          Microsoft Excel Speadsheet(*.XLS)

·          DBF

FineReader відкриваєфайли наступних форматів:

BMP: 2-бітний- ч/б, 4- і 8-бітний – Palette, 16-бітний, 24-бітний — Palette і TrueColor,32-бітний

PCX, DCX: 2-бітний- ч/б, 4- і 8-бітній — сірий

JPEG: сірийта TrueColor

TIFF: ч/б- незжатий, CCITT3, CCITT3FAX, CCITT4, Packbits сірі — незжатий, Packbits, JPEGTrueColor — незжатий, JPEG Palette — незжатий, Packbits багатосторінковий TIFF

 PNG: ч/б,сірий, кольоровий

FineReader зберігаєзображення в наступних форматах:

BMP:         ч/б,сірий, кольоровий

PCX:           ч/б,сірий

JPEG: сірий,кольоровий

TIFF: ч/б- незжаті, CCITT3, CCITT4, packbits

сірі — незжаті, packbits, JPEG

кольорові — незжатий і JPEG

PNG: ч/б,сірий, кольоровий

Програма FineReader підтримуєнаступні мови:

1.        Основні мови ( англійська, вірменська (східна,західна, грабар), болгарська, грецька, датська, іспанська, італійська,каталонська, литовська, латишська, німецька (стара і нова орфографія), нідерландська(Нідерланди і Бельгія), норвезька (нюнорск і букмол), польська, португальська(Португалія і Бразилія), російська, румунська, словацька, татарська,турецька, угорська, українська, фінська, французька, хорватська, чеська,шведська, естонська ).

2.        Додаткові мови ( абхазька, аварська, агульска,адигейська, азербайджанська (кирилиця), зербайджанська (латиниця), аймара,албанська, алтайська, африканс, ацтекська, білоруська, бемба, блекфут,бретонська, буготу, бурятська, волоф, гавайська, гагаузька, галісійська, ганда,гуарані, гелау, дакота, дунганська, евенкійська, евенська, ескімоська(кирилиця), ескімоська (латиниця), інгушська, індонезійська, ірландська,ісландська, кабардино-черкеська, казахська, калмицька, каракалпацька,карачаєво-балкарська, кашубська, кечуа, кикуйю, киргизька, конго, корсиканська,корякська, коса, кпелле, кроу, кримськотатарська, кумикська, курдська, лакська,латинська, лезгинська, лубу, лужицька, майя, македонська, малагасійська,малайзійська, малінке, мальтійська, мансійська, маорі, марійська, мінангкабау,могавк, молдавська, монгольська, мордовська, мяо, німецька (Люксембург),ненецька, нівхська, ногайска, ньянджа, оджибве, осетинська, папьяменто,південна сото, провансальська, ретороманська, руанда, рунді, російська (стараорфографія), саамська, самоа, сапотек, свази, себуанська, селькупська, сербська(кирилиця), словенська, сомалі, суахілі, сунданська, табасаранська, тагальська,таджицька, таїті, ток-пісін, тонга, тсвана, тувинська, туркменська, удмуртська,уельська, уельська, узбецька (кирилиця), узбецька (латиниця), фарерські, фіджі,фризька, фриульска, хакаська хані (акха), хантийська, хауса, цзинпо (качин), циганська,чаморро, чеченська, чуваська, чукотська, шона, якутська ).

3.        Штучні мови ( есперанто, ідо, інтерлінгва, окциденталь ).

4.        Мови програмування


ВИСНОВКИ

Використовуючи матеріал даноїдипломної роботи можна довідатися про те, як ввести потрібний документ укомп'ютер, практично нічого не знаючи про систему FineReader. Тут наводитьсяогляд основних елементів системи FineReader, таких як вікна системи, панеліінструментів, панель поточного стану. Подано типові рекомендації щодо скануваннятекстів, вибору оптимального режиму сканування; висвітлено основні методироботи стосовно розпізнавання, редагування та збереження інформації засобамипрограми FineReader. У параграфі “Додаткова інформація” даної дипломної роботи,наведені деякі дані стосовно мінімальної конфігурації комп’ютера, необхідногодля нормальної роботи програми, подано формати файлів, з якими може працюватипрограма, а також наведений перелік мов розпізнавання.

Добре ознайомившись з матеріалами,приведеними у роботі, навіть початковий користувач, не маючи ніяких практичнихнавиків, зможе без особливих труднощів вводити інформацію у комп’ютер іобробляти її засобами програми FineReader.


СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ

 

1.  Ботт Эд, Леонард Вудди. Коппьютерная энциклопедия.специальное издание: Пер с англ.: Уч. пос. – М.: Издательский дом «Вильямс»,2000. – 1024 с.: ил. – Парал. тит. англ.

2.  Гаевский А. Ю. Самоучитель работы наперсональном компьютере. – К.: А. С. К., 2001. – 416 с.: ил.

3.  Кривич Е. Я. Персональный компьютер дляшкольников: Учебный курс. – Харьков: ФОЛИО, — 2002. – 476 с: ил.

4.  Журин А.А. Работа на компьютере.Практическое руководство для начинающих пользователей. – М.: Лист-Нью, 2002. –704 с.

5.  Глушаков С.В., Жакин И.А., Хачиров Т.С.Математическое моделирование: Учебный курс — М.: ООО “Издательство АСТ”, 2001.– 542 с.

еще рефераты
Еще работы по информатике, программированию