speech-to-text-system
Et system der konverterer talt sprog til maskinlæsbar tekst.
Kort fortalt
Et speech-to-text-system omsætter tale til tekst, så du f.eks. kan diktere en besked eller få undertekster.
- Kategori
- teknik
- Niveau
- begynder
Betydninger
1- 1
System der ved hjælp af automatisk talegenkendelse omdanner akustiske talesignaler til tekst.
- I dag bruges speech-to-text-systemer i vid udstrækning til diktering og undertekstning.
- Et moderne speech-to-text-system kan håndtere flere sprog og accenter.
Hvornår bruges det
Bruges typisk i forbindelse med stemmestyring, diktering og undertekstgenerering. Systemet består af en akustisk model, en sprogmodel og en dekoder.
Kodeeksempel
import speech_recognition as sr
recognizer = sr.Recognizer()
with sr.Microphone() as source:
audio = recognizer.listen(source)
text = recognizer.recognize_google(audio)
print(text)Eksempel på brug af Python-biblioteket speech_recognition til at optage tale og omdanne til tekst.
Oprindelse
Sammensat af 'speech-to-text' (tale-til-tekst) og 'system'. Teknologien bygger på automatisk talegenkendelse (ASR).
Kilder
2- Jurafsky, D., & Martin, J. H. (2023). Speech and Language Processing (3rd ed. draft).
- Graves, A., Mohamed, A., & Hinton, G. (2013). Speech recognition with deep recurrent neural networks. ICASSP.