Speech-to-text
Teknologi der konverterer talt sprog til skriftlig tekst.
Kort fortalt
Gør det muligt for en computer at forstå og nedskrive det du siger.
- Kategori
- teknik
- Niveau
- begynder
- Udtale
- /spiːtʃ tuː tɛkst/
Betydninger
1- 1
System eller model der omdanner akustiske signaler fra menneskelig tale til en sekvens af ord i tekstform.
- Speech-to-text-teknologi bruges i dag i virtuelle assistenter som Siri og Alexa.
- Mange videoredigeringsprogrammer tilbyder automatisk undertekstning via speech-to-text.
Hvornår bruges det
Anvendes i transskription af møder, stemmestyring af enheder og automatisk generering af undertekster.
Kodeeksempel
import speech_recognition as sr
recognizer = sr.Recognizer()
with sr.Microphone() as source:
print("Say something:")
audio = recognizer.listen(source)
try:
text = recognizer.recognize_google(audio, language="da-DK")
print(f"You said: {text}")
except sr.UnknownValueError:
print("Could not understand audio")
except sr.RequestError as e:
print(f"Error: {e}")Simpelt eksempel på speech-to-text ved hjælp af SpeechRecognition-biblioteket og Googles talegenkendelse.
Oprindelse
Fra engelsk 'speech-to-text', direkte beskrivelse af processen: tale til tekst.
Afledte ord
1Kilder
2- Google Cloud Speech-to-Text
- OpenAI Whisper