Tiede

Mikä on okr? »Sen määritelmä ja merkitys

Anonim

OCR on optista merkintunnistusta tai tunnetaan myös espanjassa nimellä optinen merkintunnistus. OCR on ohjelmisto, joka mahdollistaa tekstintunnistuksen tuottamalla siitä kuvan, joka muuntaa sen peräkkäin merkkeinä, ja tallentaa ne sitten tietyssä muodossa, jota voidaan käyttää kyseisissä tekstinmuokkausohjelmissa. Toisin sanoen tämän uuden tekniikan ansiosta kaikenlaiset tekstit tai asiakirjat, mukaan lukien PDF-tiedostot, skannatut paperit tai jopa digitaalikameroista otetut kuvat, voidaan muuntaa dataksi, jotta niitä voidaan muokata.

Tämä ohjelmisto toimii seuraavalla tavalla, ensin se analysoi kunkin asiakirjan kuvan osan; jaa sivu muun muassa taulukoina, kuvina, tekstilohkoina; sitten rivit jaetaan sanoilla, jotta niistä tulee myöhemmin merkkejä; ja koska merkit on jo ilmoitettu, ohjelmisto vertaa mallin kuvaryhmää. Tämä etenee sarjan hypoteesien mukaan siitä, mitä kukin merkki on; ja näiden hypoteesien perusteella se analysoi eri vaihtoehtoja rivien jakamisesta sanoiksi ja sanojen merkkeiksi. Ja hypoteesien suuren analyysin ja käsittelyn jälkeen ohjelma esittelee lopulta jo tunnistetun ja muunnetun tekstin uudella muodolla.

On huomattava, että tänään on olemassa joukko ohjelmia, joita tietokonemarkkinat tarjoavat OCR: n perusteella, kuten OmniPage, Abbyy Fine Reader tai READiris. YY, joilla on kyky paitsi analysoida ja tunnistaa teksti sellaisenaan, myös tunnistaa muoto ja tyyli, mutta tietyin rajoituksin, mikä edellyttää, että tekstiä muokataan analysoinnin jälkeen tarvittavien muutosten tekemiseksi vaatia.