OCR-teknologi
forkortelse for Optical Character Recognition-teknologi
OCR-teknologi er en teknik til at genkende og digitalisere tekst fra billeder eller scannede dokumenter.
Kort fortalt
Kort fortalt: OCR-teknologi gør det muligt at omdanne trykt eller håndskrevet tekst i billeder til redigerbar og søgbar digital tekst.
- Kategori
- teknik
- Niveau
- begynder
Betydninger
1- 1
Teknologien til at omdanne billeder af tekst (scannet eller fotograferet) til maskinlæsbar tekst ved hjælp af mønstergenkendelse, ofte med kunstig intelligens.
- OCR-teknologi anvendes til at digitalisere historiske aviser, så de kan søges i elektronisk.
- Moderne OCR-systemer bruger deep learning til at forbedre genkendelsesnøjagtigheden af håndskrift.
Hvornår bruges det
OCR bruges i dokumentdigitalisering, automatisk nummerpladegenkendelse, fakturascanning, tilgængelighed for synshandicappede og mange andre applikationer, hvor tekst skal udtrækkes fra billeder.
Kodeeksempel
import pytesseract
from PIL import Image
img = Image.open('tekst.png')
tekst = pytesseract.image_to_string(img, lang='dan')
print(tekst)Eksempel på brug af Tesseract OCR i Python til at læse dansk tekst fra et billede.
Oprindelse
Fra engelsk 'Optical Character Recognition', hvor 'optical' henviser til optisk (lysbåret), 'character' til tegn/bogstav og 'recognition' til genkendelse.
Afledte ord
2Kilder
2- Tesseract OCR
- Google Cloud Vision API OCR