OCR-software

forkortelse for Optical Character Recognition

Software der automatisk genkender og udtrækker trykt eller håndskreven tekst fra scannede dokumenter, billeder eller PDF-filer.

Kort fortalt

OCR-software gør det muligt at konvertere tekst i billeder til redigerbar og søgbar tekst.

Kategori
værktøj
Niveau
begynder

Betydninger

1
  1. 1

    Software der anvender optisk tegngenkendelse til at konvertere billeder af tekst til maskinlæsbar tekst.

    • OCR-softwaren blev brugt til at digitalisere arkiverne.
    • Moderne OCR-software kan håndtere flere sprog og skrifttyper.

Hvornår bruges det

OCR-software bruges til at digitalisere scannede dokumenter, automatisere dataindtastning, genkende nummerplader, og tilgængeliggøre trykt tekst for synshandicappede.

Kodeeksempel

import pytesseract
from PIL import Image

text = pytesseract.image_to_string(Image.open('billede.png'))
print(text)

Eksempel på brug af Tesseract OCR i Python.

Oprindelse

OCR er en forkortelse for 'Optical Character Recognition' (optisk tegngenkendelse).

Afledte ord

2

Kilder

2
  • Tesseract OCR
  • Google Cloud Vision API