Студенческий сайт КФУ - ex ТНУ » Учебный раздел » Учебные файлы »Информатика

Сканування та розпізнавання тексту

Тип: Реферат
Категория: Информатика
Скачать
Купить

Сам процес сканування дуже простий, хоча його результати можуть істотно розрізнятися і залежать від якості оригіналу (сканованого документа). Сторінка, що містить текст, поміщається на стіл для оригіналів і запускається програма розпізнавання тексту. У цій програмі (у даній роботі це FineReader) задаються параметри сканування і тип текстового файлу. Після завершення сканування ми одержуємо текстовий файл, який можна відкрити і редагувати в Word або будь-якій іншій аналогічній програмі.

У минулому OCR-сканери могли розпізнавати тільки певні шрифти, які називалися OCR-шрифтами, а документи, призначені для сканування, також друкувалися цими шрифтами. Для генерації OCR-шрифтів використовувалися спеціальні пишучі машинки.

Крім того, для оригіналів необхідно було використовувати спеціальний папір з дуже високим ступенем білизни (в цьому випадку сканеру простіше відділити чорний шрифт від фону). Ці пристрої дійсно були достатньо капризними, але, оскільки OCR-програми прогресували достатньо швидко, з часом вони навчилися розпізнавати практично будь-який надрукований шрифт, за винятком шрифтів, що імітують рукописний текст.

Для прикладу OCR-системи я вибрав програму ABBYY FineReader 7.0. Багато користувачів комп'ютерів що мають сканер застосовують для сканування і розпізнавання тексту саме цю програму.

Сканер — це «пристрій, що використовується для аналізу початкового зображення або тексту, його оцифровки і збереження з метою подальшої обробки і висновку».

Другие файлы:

Комплекс розпізнавання письмового тексту
Сегментація і нормалізація зображень. Основні функціональні можливості та режими роботи комплексу розпізнавання письмового тексту. Розробка комплексу...

Системи розпізнавання образів
Історія досліджень, пов’язаних з розпізнаванням образів, його практичне використання. Методи розпізнавання образів: метод перебору, глибокий аналіз ха...

Системи оптичного розпізнавання образів
Алгоритм оптичного розпізнавання образів. Універсальність таких алгоритмів. Технологічність, зручність у процесі використання програми. Два класи алго...

Інтелектуальна система сегментації кольорових зображень для задач розпізнавання облич
Комп’ютерне моделювання системи сегментації та розпізнавання облич на зображеннях. Підвищення швидкодії моделювання за кольором шкіри та покращення як...

Інформаційний синтез системи автоматичного розпізнавання бланків документів
Огляд методів розпізнавання образів. Основні ідеї інформаційно-екстремального методу розпізнавання рукописних символів. Критерій оптимізації параметрі...