OCR-teknologi

forkortelse for Optical Character Recognition-teknologi

OCR-teknologi er en teknik til at genkende og digitalisere tekst fra billeder eller scannede dokumenter.

Kort fortalt

Kort fortalt: OCR-teknologi gør det muligt at omdanne trykt eller håndskrevet tekst i billeder til redigerbar og søgbar digital tekst.

Kategori
teknik
Niveau
begynder

Betydninger

1
  1. 1

    Teknologien til at omdanne billeder af tekst (scannet eller fotograferet) til maskinlæsbar tekst ved hjælp af mønstergenkendelse, ofte med kunstig intelligens.

    • OCR-teknologi anvendes til at digitalisere historiske aviser, så de kan søges i elektronisk.
    • Moderne OCR-systemer bruger deep learning til at forbedre genkendelsesnøjagtigheden af håndskrift.

Hvornår bruges det

OCR bruges i dokumentdigitalisering, automatisk nummerpladegenkendelse, fakturascanning, tilgængelighed for synshandicappede og mange andre applikationer, hvor tekst skal udtrækkes fra billeder.

Kodeeksempel

import pytesseract
from PIL import Image

img = Image.open('tekst.png')
tekst = pytesseract.image_to_string(img, lang='dan')
print(tekst)

Eksempel på brug af Tesseract OCR i Python til at læse dansk tekst fra et billede.

Oprindelse

Fra engelsk 'Optical Character Recognition', hvor 'optical' henviser til optisk (lysbåret), 'character' til tegn/bogstav og 'recognition' til genkendelse.

Afledte ord

2

Kilder

2
  • Tesseract OCR
  • Google Cloud Vision API OCR