ОCR-технології для розпізнавання паперових документів.

Словничок:
(записати в зошит)
Оптичне розпізнавання тексту (англ. optical character recognition, OCR) – це механічне або електронне переведення зображень рукописного, машинописного або друкованого тексту в послідовність кодів, що використовуються для представлення в текстовому редакторі. Розпізнавання широко використовується для конвертації книг і документів в електронний вигляд, для автоматизації систем обліку в бізнесі або для публікації тексту на веб-сторінці. Оптичне розпізнавання тексту є досліджуваною проблемою в галузях розпізнавання образів, штучного інтелекту і комп'ютерного зору. Системи оптичного розпізнавання тексту вимагають калібрування для роботи з конкретним шрифтом; у ранніх версіях, для програмування було необхідно зображення кожного символу, програма одночасно могла працювати тільки з одним шрифтом. Зараз найпоширеніші так звані «інтелектуальні» системи, що розпізнають більшість шрифтів із високим ступенем точності. Деякі системи оптичного розпізнавання тексту здатні відновлювати вихідне форматування тексту, включаючи зображення, колонки й інші нетекстові компоненти.


Завдання для учнів
1. Зробити PrintScreen сторінки http://liubiaz-school-metod.volyn.sch.in.ua/ в браузері та зберегти його як зображення.
2. Описати процес розпізнавання отриманого зображення у будь-яких двох
сервісах.
3. Описати різницю між отриманими результатами.

Вимоги до звіту
Звіт повинен містити:
 короткі теоретичні відомості;
 опис основних дій, які виконувались впродовж домашньої роботи;
 графічний матеріал у вигляді PrintScreen з відповідними коментарями до усіх
пунктів ходу роботи;
 висновки.
Результати виконаної роботи надсилати на (виберіть один зручний для вас спосіб):
  • bopoha13@gmail.com
  • Олеся Хвесик в особисті повідомлення
  • в Viber (за номером звертайтесь  в приватні повідомлення)