Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные, использующиеся для представления символов в компьютере (например, в текстовом редакторе). Распознавание широко применяется для преобразования книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание символов позволяет редактировать текст, осуществлять поиск слов или фраз, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения.
Системы оптического распознавания текста требуют калибровки для работы с конкретным шрифтом; в ранних версиях для программирования было необходимо изображение каждого символа, программа одновременно могла работать только с одним шрифтом. В настоящее время больше всего распространены так называемые «интеллектуальные» системы, с высокой степенью точности распознающие большинство шрифтов. Некоторые системы оптического распознавания текста способны восстанавливать исходное форматирование текста, включая изображения, колонки и другие нетекстовые компоненты.
История
В 1929 году Густав Таушек (нем. Gustav Tauschek) получил патент на метод оптического распознавания текста в Германии, после чего за ним последовал Гендель (англ. Paul W. Handel), получив патент на свой метод в США в 1933. В 1935 году Таушек также получил патент США на свой метод. Машина Таушека представляла собой механическое устройство, которое использовало шаблоны и фотодетектор.
В 1950 году Дэвид Х. Шепард (англ. David H. Shepard), криптоаналитик из агентства безопасности вооружённых сил Соединённых Штатов, проанализировав задачу преобразования печатных сообщений в машинный язык для обработки компьютером, построил машину, решающую данную задачу. После того как он получил патент США, он сообщил об этом в «Вашингтон Дэйли Ньюз» (27 апреля 1951) и в «Нью-Йорк Таймс» (26 декабря 1953). Затем Шепард основал компанию, разрабатывающую интеллектуальные машины, которая вскоре выпустила первые в мире коммерческие системы оптического распознавания символов.
Первая коммерческая система была установлена в «Ридерс дайджест» в 1955 году. Вторая система была продана компании «Стандарт ойл» для чтения кредитных карт для работы с чеками. Другие системы, поставлявшиеся компанией Шепарда, были проданы в конце 1950-х годов, в том числе сканер страниц для национальных воздушных сил США, предназначенный для чтения и передачи по телетайпу машинописных сообщений. IBM позже получила лицензию на использование патентов Шепарда.
Примерно в 1965 году «Ридерс дайджест» и «Ар-Си-Эй» начали сотрудничество с целью создать машину для чтения документов, использующую оптическое распознавание текста, предназначенную для оцифровки серийных номеров купонов «Ридерс дайджест», вернувшихся из рекламных объявлений. Для печати на документах барабанным принтером «Ар-Си-Эй» был использован специальный шрифт . Машина для чтения документов работала непосредственно с компьютером RCA 301 (одна из первых полупроводниковых ЭВМ). Скорость работы машины была 1500 документов в минуту: она проверяла каждый документ, исключая те, которые она не смогла обработать правильно.
Почтовая служба Соединённых Штатов с 1965 года для сортировки почты использует машины, работающие по принципу оптического распознавания текста, созданные на основе технологий, разработанных исследователем Яковом Рабиновым. В Европе первой организацией, использующей машины с оптическим распознаванием текста, был британский почтамт. Почта Канады использует системы оптического распознавания символов с 1971 года. На первом этапе в центре сортировки системы оптического распознавания символов считывают имя и адрес получателя и печатают на конверте штрихкод. Он наносится специальными чернилами, которые отчётливо видимы в ультрафиолетовом свете. Это делается, чтобы избежать путаницы с полем адреса, заполненным человеком, которое может быть в любом месте на конверте.
В 1974 году Рэй Курцвейл создал компанию «Курцвейл компьютер продактс» и начал работать над развитием первой системы оптического распознавания символов, способной распознать текст, напечатанный любым шрифтом. Курцвейл считал, что лучшее применение этой технологии — создание машины чтения для слепых, которая позволила бы слепым людям иметь компьютер, умеющий читать текст вслух. Данное устройство требовало изобретения сразу двух технологий — ПЗС планшетного сканера и синтезатора, преобразующего текст в речь. Конечный продукт был представлен 13 января 1976 во время пресс-конференции, возглавлявшейся Курцвейлом и руководителями Национальной федерации слепых.
В 1978 году компания «Курцвейл компьютер продактс» начала продажи первой коммерчески успешной компьютерной программы оптического распознавания символов. Два года спустя Курцвейл продал свою компанию корпорации «Ксерокс», которая была заинтересована в дальнейшей коммерциализации систем распознавания текста. «Курцвейл компьютер продактс» стала дочерней компанией «Ксерокс», известной как «Скансофт».
Первой программой, распознающей кириллицу, была программа «AutoR» российской компании «ОКРУС». Программа начала распространяться в 1992 году, работала под управлением операционной системы DOS и обеспечивала приемлемое по скорости и качеству распознавание даже на персональных компьютерах (IBM PC/XT) с процессором Intel 8088 при тактовой частоте 4,77 МГц. В начале 90-х компания Hewlett-Packard поставляла свои сканеры на российский рынок в комплекте с программой «AutoR». Алгоритм «AutoR» был компактный, быстрый и в полной мере «интеллектуальный», то есть по-настоящему шрифтонезависимый. Этот алгоритм разработали и испытали ещё в конце 60-х два молодых биофизика, выпускники МФТИ — Г. М. Зенкин и А. П. Петров. Свой метод распознавания они опубликовали в журнале «Биофизика» в номере 12, вып. 3 за 1967 год. В настоящее время алгоритм Зенкина-Петрова применяется в нескольких прикладных системах, решающих задачу распознавания графических символов. На основе алгоритма компанией Paragon Software Group в 1996 была создана технология . Г. М. Зенкин продолжил работу над технологией PenReader в компании Paragon Software Group. Технология используется в одноимённом продукте компании.
В 1993 году вышла технология распознавания текстов российской компании ABBYY. На её основе создан ряд корпоративных решений и программ для массовых пользователей. В частности, программа для распознавания текстов ABBYY FineReader, приложения для распознавания текстовой информации с мобильных устройств, система потокового ввода документов и данных ABBYY FlexiCapture. Лицензиарами технологий распознавания текстов ABBYY OCR являются международные ИТ-компании, такие как Fujitsu, Panasonic, Xerox, Samsung, EMC и другие.
Текущее состояние технологии оптического распознавания текста
Точное распознавание латинских символов в печатном тексте в настоящее время возможно, только если доступны чёткие изображения, такие, как сканированные печатные документы. Точность при такой постановке задачи превышает 99 %, абсолютная точность может быть достигнута только путём последующего редактирования человеком. Проблемы распознавания рукописного «печатного» и стандартного рукописного текста, а также печатных текстов других форматов (особенно с очень большим числом символов) в настоящее время являются предметом активных исследований.
Точность работы методов может быть измерена несколькими способами и поэтому может сильно варьироваться. К примеру, если встречается специализированное слово, не используемое для соответствующего программного обеспечения, при поиске несуществующих слов, ошибка может увеличиться.
Распознавание символов онлайн иногда путают с оптическим распознаванием символов. Последний — это офлайн-метод, работающий со статической формой представления текста, в то время как онлайн-распознавание символов учитывает движения во время письма. Например, в онлайн-распознавании, использующем PenPoint OS или планшетный ПК, можно определить, с какой стороны пишется строка: справа налево или слева направо.
Онлайн-системы для распознавания рукописного текста «на лету» в последнее время стали широко известны в качестве коммерческих продуктов. Алгоритмы таких устройств используют тот факт, что порядок, скорость и направление отдельных участков линий ввода известны. Кроме того, пользователь научится использовать только конкретные формы письма. Эти методы не могут быть использованы в программном обеспечении, которое использует сканированные бумажные документы, поэтому проблема распознавания рукописного «печатного» текста по-прежнему остаётся открытой. На изображениях с рукописным «печатным» текстом без артефактов может быть достигнута точность в 80 % — 90 %, но с такой точностью изображение будет преобразовано с десятками ошибок на странице. Такая технология может быть полезна лишь в очень ограниченном числе приложений.
Ещё одной широко исследуемой задачей является распознавание рукописного текста. В данное время достигнутая точность даже ниже, чем для рукописного «печатного» текста. Более высокие показатели могут быть достигнуты только с использованием контекстной и грамматической информации. Например, в ходе распознания искать целые слова в словаре легче, чем пытаться выявить отдельные знаки из текста. Знание грамматики языка может также помочь определить, является ли слово глаголом или существительным. Формы отдельных рукописных символов иногда могут не содержать достаточно информации, чтобы точно (более 98 %) распознать весь рукописный текст.
Для решения более сложных задач в области распознавания используются, как правило, интеллектуальные системы распознавания, такие, как искусственные нейронные сети.
Для калибровки систем распознавания текста создана стандартная база данных MNIST, состоящая из изображений рукописных цифр.
Примечания
- Новый PenReader теперь доступен для iPhone, iPod touch и iPad . apps4all.ru. Дата обращения: 1 февраля 2016. 13 августа 2016 года.
- Россияне выпустили приложение для рукописного ввода на iPhone и iPad - CNews . CNews.ru. Дата обращения: 1 февраля 2016. 17 января 2016 года.
- ABBYY научила Samsung Galaxy S4 распознавать текст на изображениях . Дата обращения: 3 июня 2015. 27 января 2016 года.
См. также
- CAPTCHA
- Распознавание образов
- Распознавание речи
- [англ.]
- [англ.]
Ссылки
- Unicode OCR — Hex Range: 2440-245F от 27 июня 2010 на Wayback Machine Оптическое распознавание символов в Юникоде (англ.)
- Оптическое распознавание символов в Linux от 2 апреля 2013 на Wayback Machine
Для улучшения этой статьи :
|
Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер
Opticheskoe raspoznavanie simvolov angl optical character recognition OCR mehanicheskij ili elektronnyj perevod izobrazhenij rukopisnogo mashinopisnogo ili pechatnogo teksta v tekstovye dannye ispolzuyushiesya dlya predstavleniya simvolov v kompyutere naprimer v tekstovom redaktore Raspoznavanie shiroko primenyaetsya dlya preobrazovaniya knig i dokumentov v elektronnyj vid dlya avtomatizacii sistem uchyota v biznese ili dlya publikacii teksta na veb stranice Opticheskoe raspoznavanie simvolov pozvolyaet redaktirovat tekst osushestvlyat poisk slov ili fraz hranit ego v bolee kompaktnoj forme demonstrirovat ili raspechatyvat material ne teryaya kachestva analizirovat informaciyu a takzhe primenyat k tekstu elektronnyj perevod formatirovanie ili preobrazovanie v rech Opticheskoe raspoznavanie teksta yavlyaetsya issleduemoj problemoj v oblastyah raspoznavaniya obrazov iskusstvennogo intellekta i kompyuternogo zreniya Sistemy opticheskogo raspoznavaniya teksta trebuyut kalibrovki dlya raboty s konkretnym shriftom v rannih versiyah dlya programmirovaniya bylo neobhodimo izobrazhenie kazhdogo simvola programma odnovremenno mogla rabotat tolko s odnim shriftom V nastoyashee vremya bolshe vsego rasprostraneny tak nazyvaemye intellektualnye sistemy s vysokoj stepenyu tochnosti raspoznayushie bolshinstvo shriftov Nekotorye sistemy opticheskogo raspoznavaniya teksta sposobny vosstanavlivat ishodnoe formatirovanie teksta vklyuchaya izobrazheniya kolonki i drugie netekstovye komponenty IstoriyaV 1929 godu Gustav Taushek nem Gustav Tauschek poluchil patent na metod opticheskogo raspoznavaniya teksta v Germanii posle chego za nim posledoval Gendel angl Paul W Handel poluchiv patent na svoj metod v SShA v 1933 V 1935 godu Taushek takzhe poluchil patent SShA na svoj metod Mashina Tausheka predstavlyala soboj mehanicheskoe ustrojstvo kotoroe ispolzovalo shablony i fotodetektor V 1950 godu Devid H Shepard angl David H Shepard kriptoanalitik iz agentstva bezopasnosti vooruzhyonnyh sil Soedinyonnyh Shtatov proanalizirovav zadachu preobrazovaniya pechatnyh soobshenij v mashinnyj yazyk dlya obrabotki kompyuterom postroil mashinu reshayushuyu dannuyu zadachu Posle togo kak on poluchil patent SShA on soobshil ob etom v Vashington Dejli Nyuz 27 aprelya 1951 i v Nyu Jork Tajms 26 dekabrya 1953 Zatem Shepard osnoval kompaniyu razrabatyvayushuyu intellektualnye mashiny kotoraya vskore vypustila pervye v mire kommercheskie sistemy opticheskogo raspoznavaniya simvolov Pervaya kommercheskaya sistema byla ustanovlena v Riders dajdzhest v 1955 godu Vtoraya sistema byla prodana kompanii Standart ojl dlya chteniya kreditnyh kart dlya raboty s chekami Drugie sistemy postavlyavshiesya kompaniej Sheparda byli prodany v konce 1950 h godov v tom chisle skaner stranic dlya nacionalnyh vozdushnyh sil SShA prednaznachennyj dlya chteniya i peredachi po teletajpu mashinopisnyh soobshenij IBM pozzhe poluchila licenziyu na ispolzovanie patentov Sheparda Primerno v 1965 godu Riders dajdzhest i Ar Si Ej nachali sotrudnichestvo s celyu sozdat mashinu dlya chteniya dokumentov ispolzuyushuyu opticheskoe raspoznavanie teksta prednaznachennuyu dlya ocifrovki serijnyh nomerov kuponov Riders dajdzhest vernuvshihsya iz reklamnyh obyavlenij Dlya pechati na dokumentah barabannym printerom Ar Si Ej byl ispolzovan specialnyj shrift Mashina dlya chteniya dokumentov rabotala neposredstvenno s kompyuterom RCA 301 odna iz pervyh poluprovodnikovyh EVM Skorost raboty mashiny byla 1500 dokumentov v minutu ona proveryala kazhdyj dokument isklyuchaya te kotorye ona ne smogla obrabotat pravilno Pochtovaya sluzhba Soedinyonnyh Shtatov s 1965 goda dlya sortirovki pochty ispolzuet mashiny rabotayushie po principu opticheskogo raspoznavaniya teksta sozdannye na osnove tehnologij razrabotannyh issledovatelem Yakovom Rabinovym V Evrope pervoj organizaciej ispolzuyushej mashiny s opticheskim raspoznavaniem teksta byl britanskij pochtamt Pochta Kanady ispolzuet sistemy opticheskogo raspoznavaniya simvolov s 1971 goda Na pervom etape v centre sortirovki sistemy opticheskogo raspoznavaniya simvolov schityvayut imya i adres poluchatelya i pechatayut na konverte shtrihkod On nanositsya specialnymi chernilami kotorye otchyotlivo vidimy v ultrafioletovom svete Eto delaetsya chtoby izbezhat putanicy s polem adresa zapolnennym chelovekom kotoroe mozhet byt v lyubom meste na konverte V 1974 godu Rej Kurcvejl sozdal kompaniyu Kurcvejl kompyuter prodakts i nachal rabotat nad razvitiem pervoj sistemy opticheskogo raspoznavaniya simvolov sposobnoj raspoznat tekst napechatannyj lyubym shriftom Kurcvejl schital chto luchshee primenenie etoj tehnologii sozdanie mashiny chteniya dlya slepyh kotoraya pozvolila by slepym lyudyam imet kompyuter umeyushij chitat tekst vsluh Dannoe ustrojstvo trebovalo izobreteniya srazu dvuh tehnologij PZS planshetnogo skanera i sintezatora preobrazuyushego tekst v rech Konechnyj produkt byl predstavlen 13 yanvarya 1976 vo vremya press konferencii vozglavlyavshejsya Kurcvejlom i rukovoditelyami Nacionalnoj federacii slepyh V 1978 godu kompaniya Kurcvejl kompyuter prodakts nachala prodazhi pervoj kommercheski uspeshnoj kompyuternoj programmy opticheskogo raspoznavaniya simvolov Dva goda spustya Kurcvejl prodal svoyu kompaniyu korporacii Kseroks kotoraya byla zainteresovana v dalnejshej kommercializacii sistem raspoznavaniya teksta Kurcvejl kompyuter prodakts stala dochernej kompaniej Kseroks izvestnoj kak Skansoft Pervoj programmoj raspoznayushej kirillicu byla programma AutoR rossijskoj kompanii OKRUS Programma nachala rasprostranyatsya v 1992 godu rabotala pod upravleniem operacionnoj sistemy DOS i obespechivala priemlemoe po skorosti i kachestvu raspoznavanie dazhe na personalnyh kompyuterah IBM PC XT s processorom Intel 8088 pri taktovoj chastote 4 77 MGc V nachale 90 h kompaniya Hewlett Packard postavlyala svoi skanery na rossijskij rynok v komplekte s programmoj AutoR Algoritm AutoR byl kompaktnyj bystryj i v polnoj mere intellektualnyj to est po nastoyashemu shriftonezavisimyj Etot algoritm razrabotali i ispytali eshyo v konce 60 h dva molodyh biofizika vypuskniki MFTI G M Zenkin i A P Petrov Svoj metod raspoznavaniya oni opublikovali v zhurnale Biofizika v nomere 12 vyp 3 za 1967 god V nastoyashee vremya algoritm Zenkina Petrova primenyaetsya v neskolkih prikladnyh sistemah reshayushih zadachu raspoznavaniya graficheskih simvolov Na osnove algoritma kompaniej Paragon Software Group v 1996 byla sozdana tehnologiya G M Zenkin prodolzhil rabotu nad tehnologiej PenReader v kompanii Paragon Software Group Tehnologiya ispolzuetsya v odnoimyonnom produkte kompanii V 1993 godu vyshla tehnologiya raspoznavaniya tekstov rossijskoj kompanii ABBYY Na eyo osnove sozdan ryad korporativnyh reshenij i programm dlya massovyh polzovatelej V chastnosti programma dlya raspoznavaniya tekstov ABBYY FineReader prilozheniya dlya raspoznavaniya tekstovoj informacii s mobilnyh ustrojstv sistema potokovogo vvoda dokumentov i dannyh ABBYY FlexiCapture Licenziarami tehnologij raspoznavaniya tekstov ABBYY OCR yavlyayutsya mezhdunarodnye IT kompanii takie kak Fujitsu Panasonic Xerox Samsung EMC i drugie Tekushee sostoyanie tehnologii opticheskogo raspoznavaniya tekstaTochnoe raspoznavanie latinskih simvolov v pechatnom tekste v nastoyashee vremya vozmozhno tolko esli dostupny chyotkie izobrazheniya takie kak skanirovannye pechatnye dokumenty Tochnost pri takoj postanovke zadachi prevyshaet 99 absolyutnaya tochnost mozhet byt dostignuta tolko putyom posleduyushego redaktirovaniya chelovekom Problemy raspoznavaniya rukopisnogo pechatnogo i standartnogo rukopisnogo teksta a takzhe pechatnyh tekstov drugih formatov osobenno s ochen bolshim chislom simvolov v nastoyashee vremya yavlyayutsya predmetom aktivnyh issledovanij Tochnost raboty metodov mozhet byt izmerena neskolkimi sposobami i poetomu mozhet silno varirovatsya K primeru esli vstrechaetsya specializirovannoe slovo ne ispolzuemoe dlya sootvetstvuyushego programmnogo obespecheniya pri poiske nesushestvuyushih slov oshibka mozhet uvelichitsya Raspoznavanie simvolov onlajn inogda putayut s opticheskim raspoznavaniem simvolov Poslednij eto oflajn metod rabotayushij so staticheskoj formoj predstavleniya teksta v to vremya kak onlajn raspoznavanie simvolov uchityvaet dvizheniya vo vremya pisma Naprimer v onlajn raspoznavanii ispolzuyushem PenPoint OS ili planshetnyj PK mozhno opredelit s kakoj storony pishetsya stroka sprava nalevo ili sleva napravo Onlajn sistemy dlya raspoznavaniya rukopisnogo teksta na letu v poslednee vremya stali shiroko izvestny v kachestve kommercheskih produktov Algoritmy takih ustrojstv ispolzuyut tot fakt chto poryadok skorost i napravlenie otdelnyh uchastkov linij vvoda izvestny Krome togo polzovatel nauchitsya ispolzovat tolko konkretnye formy pisma Eti metody ne mogut byt ispolzovany v programmnom obespechenii kotoroe ispolzuet skanirovannye bumazhnye dokumenty poetomu problema raspoznavaniya rukopisnogo pechatnogo teksta po prezhnemu ostayotsya otkrytoj Na izobrazheniyah s rukopisnym pechatnym tekstom bez artefaktov mozhet byt dostignuta tochnost v 80 90 no s takoj tochnostyu izobrazhenie budet preobrazovano s desyatkami oshibok na stranice Takaya tehnologiya mozhet byt polezna lish v ochen ogranichennom chisle prilozhenij Eshyo odnoj shiroko issleduemoj zadachej yavlyaetsya raspoznavanie rukopisnogo teksta V dannoe vremya dostignutaya tochnost dazhe nizhe chem dlya rukopisnogo pechatnogo teksta Bolee vysokie pokazateli mogut byt dostignuty tolko s ispolzovaniem kontekstnoj i grammaticheskoj informacii Naprimer v hode raspoznaniya iskat celye slova v slovare legche chem pytatsya vyyavit otdelnye znaki iz teksta Znanie grammatiki yazyka mozhet takzhe pomoch opredelit yavlyaetsya li slovo glagolom ili sushestvitelnym Formy otdelnyh rukopisnyh simvolov inogda mogut ne soderzhat dostatochno informacii chtoby tochno bolee 98 raspoznat ves rukopisnyj tekst Dlya resheniya bolee slozhnyh zadach v oblasti raspoznavaniya ispolzuyutsya kak pravilo intellektualnye sistemy raspoznavaniya takie kak iskusstvennye nejronnye seti Dlya kalibrovki sistem raspoznavaniya teksta sozdana standartnaya baza dannyh MNIST sostoyashaya iz izobrazhenij rukopisnyh cifr PrimechaniyaNovyj PenReader teper dostupen dlya iPhone iPod touch i iPad neopr apps4all ru Data obrasheniya 1 fevralya 2016 13 avgusta 2016 goda Rossiyane vypustili prilozhenie dlya rukopisnogo vvoda na iPhone i iPad CNews neopr CNews ru Data obrasheniya 1 fevralya 2016 17 yanvarya 2016 goda ABBYY nauchila Samsung Galaxy S4 raspoznavat tekst na izobrazheniyah neopr Data obrasheniya 3 iyunya 2015 27 yanvarya 2016 goda Sm takzheCAPTCHA Raspoznavanie obrazov Raspoznavanie rechi angl angl SsylkiMediafajly na Vikisklade Unicode OCR Hex Range 2440 245F ot 27 iyunya 2010 na Wayback Machine Opticheskoe raspoznavanie simvolov v Yunikode angl Opticheskoe raspoznavanie simvolov v Linux ot 2 aprelya 2013 na Wayback Machine Dlya uluchsheniya etoj stati zhelatelno Ispravit statyu soglasno stilisticheskim pravilam Vikipedii Posle ispravleniya problemy isklyuchite eyo iz spiska Udalite shablon esli ustraneny vse nedostatki