speech-to-text-system

Et system der konverterer talt sprog til maskinlæsbar tekst.

Kort fortalt

Et speech-to-text-system omsætter tale til tekst, så du f.eks. kan diktere en besked eller få undertekster.

Kategori
teknik
Niveau
begynder

Betydninger

1
  1. 1

    System der ved hjælp af automatisk talegenkendelse omdanner akustiske talesignaler til tekst.

    • I dag bruges speech-to-text-systemer i vid udstrækning til diktering og undertekstning.
    • Et moderne speech-to-text-system kan håndtere flere sprog og accenter.

Hvornår bruges det

Bruges typisk i forbindelse med stemmestyring, diktering og undertekstgenerering. Systemet består af en akustisk model, en sprogmodel og en dekoder.

Kodeeksempel

import speech_recognition as sr

recognizer = sr.Recognizer()
with sr.Microphone() as source:
    audio = recognizer.listen(source)
text = recognizer.recognize_google(audio)
print(text)

Eksempel på brug af Python-biblioteket speech_recognition til at optage tale og omdanne til tekst.

Oprindelse

Sammensat af 'speech-to-text' (tale-til-tekst) og 'system'. Teknologien bygger på automatisk talegenkendelse (ASR).

Kilder

2
  • Jurafsky, D., & Martin, J. H. (2023). Speech and Language Processing (3rd ed. draft).
  • Graves, A., Mohamed, A., & Hinton, G. (2013). Speech recognition with deep recurrent neural networks. ICASSP.