OCR-software

forkortelse for Optical Character Recognition

Software der automatisk genkender og udtrækker trykt eller håndskreven tekst fra scannede dokumenter, billeder eller PDF-filer.

Kort fortalt

OCR-software gør det muligt at konvertere tekst i billeder til redigerbar og søgbar tekst.

Kategori: værktøj
Niveau: begynder

Betydninger

1
Software der anvender optisk tegngenkendelse til at konvertere billeder af tekst til maskinlæsbar tekst.
- OCR-softwaren blev brugt til at digitalisere arkiverne.
- Moderne OCR-software kan håndtere flere sprog og skrifttyper.

Hvornår bruges det

OCR-software bruges til at digitalisere scannede dokumenter, automatisere dataindtastning, genkende nummerplader, og tilgængeliggøre trykt tekst for synshandicappede.

Kodeeksempel

import pytesseract
from PIL import Image

text = pytesseract.image_to_string(Image.open('billede.png'))
print(text)

Eksempel på brug af Tesseract OCR i Python.

Oprindelse

OCR er en forkortelse for 'Optical Character Recognition' (optisk tegngenkendelse).

Afledte ord

OCR-algoritme OCR-engine

Kilder

Tesseract OCR
Google Cloud Vision API

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i værktøj →Tilfældigt opslag →