OCR-scanning

forkortelse for Optical Character Recognition

OCR-scanning er en teknologi, der omdanner billeder af tekst til maskinlæsbar tekst ved hjælp af mønstergenkendelse og kunstig intelligens.

Kort fortalt

Det er en måde at få computeren til at læse tekst fra billeder eller scannede dokumenter, så du kan redigere eller søge i teksten.

Kategori
teknik
Niveau
begynder
Udtale
/oʊ siː ɑːr skænɪŋ/

Betydninger

1
  1. 1

    Teknologi og proces til at konvertere scannede billeder af tekst eller håndskrift til redigerbar og søgbar maskinlæsbar tekst ved hjælp af mønstergenkendelse og AI.

    • OCR-scanning af gamle bøger gør det muligt at søge i teksten digitalt.
    • Virksomheden anvender OCR-scanning til automatisk at læse fakturaer.

Hvornår bruges det

OCR-scanning bruges i vid udstrækning til digitalisering af trykte dokumenter, automatisk nummerpladegenkendelse, behandling af kvitteringer og fakturaer, samt tilgængelighedshjælpemidler som oplæsning af tekst for synshæmmede. Moderne OCR-systemer anvender deep learning-modeller for at opnå høj nøjagtighed.

Kodeeksempel

import pytesseract
from PIL import Image

image = Image.open('dokument.png')
text = pytesseract.image_to_string(image, lang='dan')
print(text)

Eksempel på OCR-scanning af et billede med Tesseract OCR-biblioteket.

Oprindelse

OCR er en forkortelse for 'Optical Character Recognition' (optisk tegngenkendelse). Konceptet stammer fra 1920'erne med Emanuel Goldbergs opfindelser, men blev praktisk anvendt i 1950'erne. 'Scanning' refererer til processen at indfange billedet.

Afledte ord

2