Text-to-speech
Teknologi der konverterer skrevet tekst til syntetisk tale.
Kort fortalt
En computer taler højt fra en tekst.
- Kategori
- teknik
- Niveau
- begynder
Betydninger
2- 1
Generel teknologi til at læse tekst højt med syntetisk stemme.
- Tekst-til-tale bruges i GPS'en til at læse vejbeskrivelser op.
- 2
Inden for AI: deep learning-modeller der genererer menneskelignende tale fra tekst.
- Moderne tekst-til-tale-modeller som Tacotron kan efterligne menneskelig intonation.
Hvornår bruges det
Bruges i stemmeassistenter, GPS, lydbøger og tilgængelighedsværktøjer. Moderne AI-modeller som Tacotron og WaveNet forbedrer naturligheden.
Kodeeksempel
import pyttsx3
engine = pyttsx3.init()
engine.say('Hello, world!')
engine.runAndWait()Simpelt eksempel med pyttsx3-biblioteket.
Oprindelse
Sammensat af 'tekst', 'til' og 'tale', lånt fra engelsk 'text-to-speech'.
Afledte ord
2Kilder
2- WaveNet: A Generative Model for Raw Audio (2016)
- Tacotron: Towards End-to-End Speech Synthesis (2017)