OCR-teknologi

forkortelse for Optical Character Recognition-teknologi

OCR-teknologi er en teknik til at genkende og digitalisere tekst fra billeder eller scannede dokumenter.

Kort fortalt

Kort fortalt: OCR-teknologi gør det muligt at omdanne trykt eller håndskrevet tekst i billeder til redigerbar og søgbar digital tekst.

Kategori: teknik
Niveau: begynder

Betydninger

1
Teknologien til at omdanne billeder af tekst (scannet eller fotograferet) til maskinlæsbar tekst ved hjælp af mønstergenkendelse, ofte med kunstig intelligens.
- OCR-teknologi anvendes til at digitalisere historiske aviser, så de kan søges i elektronisk.
- Moderne OCR-systemer bruger deep learning til at forbedre genkendelsesnøjagtigheden af håndskrift.

Hvornår bruges det

OCR bruges i dokumentdigitalisering, automatisk nummerpladegenkendelse, fakturascanning, tilgængelighed for synshandicappede og mange andre applikationer, hvor tekst skal udtrækkes fra billeder.

Kodeeksempel

import pytesseract
from PIL import Image

img = Image.open('tekst.png')
tekst = pytesseract.image_to_string(img, lang='dan')
print(tekst)

Eksempel på brug af Tesseract OCR i Python til at læse dansk tekst fra et billede.

Oprindelse

Fra engelsk 'Optical Character Recognition', hvor 'optical' henviser til optisk (lysbåret), 'character' til tegn/bogstav og 'recognition' til genkendelse.

Afledte ord

OCR-scanning OCR-genkendelse

Kilder

Tesseract OCR
Google Cloud Vision API OCR

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i teknik →Tilfældigt opslag →