Speech-to-text

Teknologi der konverterer talt sprog til skriftlig tekst.

Kort fortalt

Gør det muligt for en computer at forstå og nedskrive det du siger.

Kategori: teknik
Niveau: begynder
Udtale: /spiːtʃ tuː tɛkst/

Betydninger

1
System eller model der omdanner akustiske signaler fra menneskelig tale til en sekvens af ord i tekstform.
- Speech-to-text-teknologi bruges i dag i virtuelle assistenter som Siri og Alexa.
- Mange videoredigeringsprogrammer tilbyder automatisk undertekstning via speech-to-text.

Hvornår bruges det

Anvendes i transskription af møder, stemmestyring af enheder og automatisk generering af undertekster.

Kodeeksempel

import speech_recognition as sr

recognizer = sr.Recognizer()
with sr.Microphone() as source:
    print("Say something:")
    audio = recognizer.listen(source)

try:
    text = recognizer.recognize_google(audio, language="da-DK")
    print(f"You said: {text}")
except sr.UnknownValueError:
    print("Could not understand audio")
except sr.RequestError as e:
    print(f"Error: {e}")

Simpelt eksempel på speech-to-text ved hjælp af SpeechRecognition-biblioteket og Googles talegenkendelse.

Oprindelse

Fra engelsk 'speech-to-text', direkte beskrivelse af processen: tale til tekst.

Afledte ord

speech-to-text-system

Kilder

Google Cloud Speech-to-Text
OpenAI Whisper

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i teknik →Tilfældigt opslag →