Speech-to-text

Teknologi der konverterer talt sprog til skriftlig tekst.

Kort fortalt

Gør det muligt for en computer at forstå og nedskrive det du siger.

Kategori
teknik
Niveau
begynder
Udtale
/spiːtʃ tuː tɛkst/

Betydninger

1
  1. 1

    System eller model der omdanner akustiske signaler fra menneskelig tale til en sekvens af ord i tekstform.

    • Speech-to-text-teknologi bruges i dag i virtuelle assistenter som Siri og Alexa.
    • Mange videoredigeringsprogrammer tilbyder automatisk undertekstning via speech-to-text.

Hvornår bruges det

Anvendes i transskription af møder, stemmestyring af enheder og automatisk generering af undertekster.

Kodeeksempel

import speech_recognition as sr

recognizer = sr.Recognizer()
with sr.Microphone() as source:
    print("Say something:")
    audio = recognizer.listen(source)

try:
    text = recognizer.recognize_google(audio, language="da-DK")
    print(f"You said: {text}")
except sr.UnknownValueError:
    print("Could not understand audio")
except sr.RequestError as e:
    print(f"Error: {e}")

Simpelt eksempel på speech-to-text ved hjælp af SpeechRecognition-biblioteket og Googles talegenkendelse.

Oprindelse

Fra engelsk 'speech-to-text', direkte beskrivelse af processen: tale til tekst.

Afledte ord

1

Kilder

2
  • Google Cloud Speech-to-Text
  • OpenAI Whisper