OCR - Optical Character Recognition - Kompjuterska grafika i dizajn - Seminarski rad

download OCR - Optical Character Recognition - Kompjuterska grafika i dizajn - Seminarski rad

of 16

  • date post

    30-Oct-2015
  • Category

    Documents

  • view

    194
  • download

    8

Embed Size (px)

description

OCR - Optical Character Recognition - Kompjuterska grafika i dizajn - Seminarski rad

Transcript of OCR - Optical Character Recognition - Kompjuterska grafika i dizajn - Seminarski rad

OCR Optical Charactet Recgnonition

SADRAJ

41.UVOD

52.Istorija razvoja OCR-a

52.1.Prvi komercijalni sitemi

62.2.OCR-A, OCR-B

73.TRENUTNO STANJE OCR TEHNOLOGIJE

73.1.Intelligent Character Recognition (ICR)

84.OCR u drugim namjenama

84.1.Music OCR

104.2.Magnetic Ink Character Recognition (MICR)

114.3.Bar Code Reader

124.4.Optical Mark Reader

135.OCR Software

156.Nain rada OCR-a

156.1.Prepoznavanje uzoraka (Pattern Matching)

156.2.Prepoznavanje posebnosti (Feature Extraction)

156.3.Provjera pravopisa (Spelling Check)

166.4.Posebni simboli

177.Zakljuak

188.Literatura

1. UvodOptiko prepoznavanje znakova (eng. OCR Optical Character Recognition), je postupak mehanikog ili elektronskog prebacivanja rukom pisanog ili tampanog teksta koristei skener u obilik koji raunar prepoznaje i moe ga mjenjati.

OCR spada pod grupu istraivanja kao to je preponavanje uzoraka, umjetna intelignecija i mainski vid. Iako se OCR jo uvjek razvija i pronalaze se novi smjeroviu fokus se usmjerio na primjenu dokazanih tehnika. Optiko prepoznavanje znakova i digitalno prepoznavanje znakova su u poetku smatrani razliitim poljima istraivanja. Zbog injenice da je jako malo aplikacija koje su korsitlile istinske optike tehnike preivjelo, termin OCR danas obuhvata i tehnike digitalne obrade slika.

Ranije sisteme je bilo potrebno nauiti kako itati pojedni font. Trenutno su dostupni inteligentni sistemi sa velikim stepenom tanosti za veliku veinu fontova. Neki sistemi su sposobni reproducirati i aproksimirati format ulaznog skeniranog dokumenta koji se moe sastoajti od slika, kolona i drugin netekstualnih dijelova.2. Istorija razvoja OCR-a

1929. godine Gustav Tauschek OCR u Njemakoj, a nakon njega je to isto napravio Handel u SAD-u 1933. godine. Tauscheku je odobren patent za njegovu metodi i u SAD-u.

Tauschekov ureaj je bio mehaniki stroj koji je korsitio ablone. Fotodetektor je bio psotavljen tako da kad su ablon i znak koji se trebalo prepoznati bili u tano odreenom poloaju te ih svjetlost obasjavala nita svjelta ne bi dolazilo do fotodetektora.1950. Frank Rowlettje zamolio kripto analitiara Davida H. Sheparda da u suradnji s dr. Louis Tordella da svoje prijedloge za automatizovanu obradu podataka. To je ukljuivalo i problem pretvaranja isprintanih poruka u mainski jezik za raunrasku obradu. Shepard je zakljuio da mora biti mogue napraviti takavu mainu i uz pomo prijatelja Harveya Cooka tijekom veeri i vikenda na svom tavanu napravio Gismo. To su objavile novine Washington Daily News 27.4.1951. godine i New York Times 26.12.1953. godine nakon to im je odobren patent U.S. Patent Number 2,663,758.

Shepard tada osniva Intelligent Machines Research Corporation (IMR) kompaniju, koja je zasluna za razvoj prvih nekoliko komercijalnih OCR sistema uopteno u svijetu.

Iako su i Gismo i prvi IMR sistemi koristili analizu slike, za razliku od usporeivanja znakova, te su tolerirali varijaciju fontova, Gismo je bio ogranien na usko vertikalno prepoznavanje, dok su kasniji komercijalni modeli IMR skenera analizirali znakove bilo gdje u skeniranom polju to je zapravo nunost za stvarne dokumente.2.1. Prvi komercijalni sitemi

Prvi komercijalni sistem je instaliran u Readers Digest 1955. Isti taj sistem je kasnije doniran Smithsonianu gdje je postavljen kao eksponat. Drugi sistem su prodali Standard Oil Company iz Kalifornije koji se koristio za itanje oznaka na kreditnim karticama. Velik broj sistema je naknadno prodan drugim naftnim kompanijama. Neki od ostalih korisnika IMR sistema kasnih 1950. godina su i Ohio Bell Telephone Company, ZrakoplovstvoSAD-a te IBM.2.2. OCR-A, OCR-B

U poecima kompjuterskog OCR-a razvila se potreba za fontom koji e moi prepoznati tada spore kompjutere , ali koji e biti itljiv i ljudima. Kao rezultat tog kompromisa se pojavio OCR-A font koji se sastojao od jednostavnih, debelih poteza koji su tvorili prepoznatljive znakove. 1968. godine American Type Founders proizvodi OCR-A, jedan od prvih oblika znakova prilagoen za optiko prepoznavanje koji je zadovoljavao kriterije ureda za standarde SAD-a (eng. U.S. Bureau of Standards). Dizajn je tako jednostavan da ga je kompjuter mogao vrlo lako proitati, tj. prepoznati, ali je neto nezgodniji za itanje ljudima. OCR-B je europski pandan tom fontu. Napravio ga je Adrian Frutiger iste godine. OCR-B font je laki ljudima za itanje od OCR-A fonta.

Postoje besplatne, ali i komercijalne inaice ovih fontova koje prodaju razliite kompanije. Iako je OCR tehnologija napredovala toliko da vie nema potrebe za ovim specijaliziranim fontovima oni i dalje ostaju u upotrebi.

Slika 1. Izgled OCR-A i OCR-B fontova3. Trenutno stanje OCR tehnologijeTano prepoznavanje isprintane latinice se smatra uglavnom rijeenim problemom. Tipian postotak tanosti prepoznavanja prekorauje 99% iako za odreene aplikacije koje zahtijevaju jo veu tanost je potrebna ljudska intervencija i pregled greaka. Ostala podruja, poput prepoznavanja rukopisa, kurziva i naina pisanja razliitog od latinice (posebno onih sa vrlo velikim brojem znakova) su i dalje predmet aktivnog istraivanja.Tanost ili preciznost moe biti mjerena na nekoliko naina o kojima jako ovisi krajnji rezultat i postotak tanosti. Npr. bez koritenja rjenika za ispravljanje pogreaka pri itanju 1% pogreka (99% tanost) se moze pretvoriti u 5% pogreku (95% tanost). OCR se ponekad krivo poistovjeuje sa on-line character recognition. OCR je tip off-line prepoznavanja znakova, gdje sistem prepoznaje fiksne i statike oblike znakova, dok on-line prepoznavanje znakova prepoznaje dinamike pokrete tokom pisanja rukom. On-line prepoznavanje znakova se ponekad naziva i dinamiko prepoznavanje znakova (dynamic character recognition), prepoznavanje znakova u realnom vremenu (real-time character recognition) i inteligentno prepoznavanje znakova (Intelligent Character Recognition, ICR).

3.1. Intelligent Character Recognition (ICR)

On-line sistemi za prepoznavanje rukom ispisanog teksta u realnom vremenu (DCR, ICR) su sve ei komercijalni proizvodi posljednjih godina. Primjeri takvih proizvoda su ureaji poput digitalnih osobnih asistenata koji koriste Palm OS. Apple Newton je bio pionir ovakvih ureaja. Algoritmi koji se koriste u ovakvim ureajima iskoritavaju injenicu da su poredak, brzina i smjer pojedinih linija i segmenata poznati. Takoer korisnika se moe nauiti da koristi samo odreene oblike slova. Ove metode se ne mogu koristiti u software-u koji skenira papirnate dokumente tako da je tano prepoznavanje rukom pisanih dokumenata jo uvijek otvoreni problem. Tanost je izmeu 80% i 90% za uredne, isto rukom ispisane znakove, ali takva tanost svejedno znai desetke greaka po stranici to je veliko ogranienje za ovu tehnologiju i ograniava njenu primjenu.Prepoznavanje kurziva je aktivno podruje istraivanja sa postotkom tanosti prepoznavanje jo manjom od onog prepoznavanja rukom pisanog teksta. Vii postotak tanosti prepoznavanja kurziva vjerojatno nee biti mogu bez kontekstualnih ili gramatikih informacija. Na primjer, prepoznavanje cijele rijei iz rjenika je lake nego obraditi individualne znakove iz teksta. Poznavanje gramatike jezika u kojem je pisan tekst koji se skenira takoer moe pomoi pri odreivanju je li rije u pitanju imenica ili glagol to omoguava veu tanost. Oblici individualnih znakovakurziva ne sadravaju dovoljno informacija da bi se tano (vie od 98%) prepoznao cijeli rukom pisani tekst u kurzivu. Potrebno je shvatiti da je OCR osnovna tehnologija koja se koristi u naprednim aplikacijama za skeniranje. Dakle, pojedino napredno tehnoloko rjeenje moe biti temeljeno na osnovnoj OCR tehnologiji.4. OCR u drugim namjenama

Na MIT-u su se sredinom 1970. godina radila prva istraivanja prepoznavanja muzikih oblika na papiru. Ulagan je trud u uklanjanje muzikih linija kako bi ostali samo simboli za prepoznavanje i obradu. Prvi komercijalni program za skeniranje muzikih nota, MIDISCAN, je izdan 1991. godine. Trenutno postoji nekoliko proizvoda tog tipa.Jedino podruje u kojem tanost i brzina raunarskog ulaza znakovnih informacija nadilazi sposobnosti ljudi je u podruju prepoznavanja znakova ispisanih magnetskom tintom gdje je jedna pogreka na svakih 20 do 30 tisua provjera. 1950. Bank of America je bila prva banka koja je koristila OCR kako bi automatizirala obradu ekova koji su u sebi sadravali takav tip znakova.4.1. Music OCR

Za razliku od prepoznavanja teksta, gdje se rijei obrauju jedna za drugom, muzike oznake je potrebno obraivati paralelno, zbog prisutnosti viestrukih glasova i drugih muzikih oznaka. Ovdje bitnu ulogu igra razmak izmeu nota, oznake za tempo i dinamiku te glazbene oznake.

Savremeni glazbeni OCR softwareski paketi imaju preciznost koja prelazi 99% u sluaju istog skena i ako su koritene standardne notacije. Poto muzike notacije koriste take za staccato oznake ili da bi se produilo trajanje note, artifakti kod skeniranja mogu dovesti do problema pri prepoznavanju.

PhotoScore Ultimate 5 je prvi programski paket koji je u mogunosti prepoznavati rukom pisane note i druge glazbene oznake koritenjem 2 razliita enginea za prepoznavanje. Oni koreliraju vlastite rezultate i tako postiu znaajno poboljanje preciznosti.ImeLicencaOperacijski sustaviKomentari

Musitek SmartScore ProKomercijalna399$ / 299$ (akademska licenca)Windows, Mac OS XEvolucija MIDISCAN programa.

PhotoScore Ultimate 5Komercijalna249$Windows, Mac OS XLagan za koritenje, sa jeftinom inaicom za nezahtjevne.

Vivaldi ScanKomercijalna152$Windows, Mac OSLagan za koritenje, brz, 99% preciznost. Dolazi s alatom za provjeru ritma.

AudiverisGNUbesplatan[5]Windows, Mac OS, Linux, SolarisBesplatan program pisan u JAVA-i. Potpuno funkci