OCR-software
forkortelse for Optical Character Recognition
Software der automatisk genkender og udtrækker trykt eller håndskreven tekst fra scannede dokumenter, billeder eller PDF-filer.
Kort fortalt
OCR-software gør det muligt at konvertere tekst i billeder til redigerbar og søgbar tekst.
- Kategori
- værktøj
- Niveau
- begynder
Betydninger
1- 1
Software der anvender optisk tegngenkendelse til at konvertere billeder af tekst til maskinlæsbar tekst.
- OCR-softwaren blev brugt til at digitalisere arkiverne.
- Moderne OCR-software kan håndtere flere sprog og skrifttyper.
Hvornår bruges det
OCR-software bruges til at digitalisere scannede dokumenter, automatisere dataindtastning, genkende nummerplader, og tilgængeliggøre trykt tekst for synshandicappede.
Kodeeksempel
import pytesseract
from PIL import Image
text = pytesseract.image_to_string(Image.open('billede.png'))
print(text)Eksempel på brug af Tesseract OCR i Python.
Oprindelse
OCR er en forkortelse for 'Optical Character Recognition' (optisk tegngenkendelse).
Afledte ord
2Kilder
2- Tesseract OCR
- Google Cloud Vision API