Text-to-speech

Teknologi der konverterer skrevet tekst til syntetisk tale.

Kort fortalt

En computer taler højt fra en tekst.

Kategori
teknik
Niveau
begynder

Betydninger

2
  1. 1

    Generel teknologi til at læse tekst højt med syntetisk stemme.

    • Tekst-til-tale bruges i GPS'en til at læse vejbeskrivelser op.
  2. 2

    Inden for AI: deep learning-modeller der genererer menneskelignende tale fra tekst.

    • Moderne tekst-til-tale-modeller som Tacotron kan efterligne menneskelig intonation.

Hvornår bruges det

Bruges i stemmeassistenter, GPS, lydbøger og tilgængelighedsværktøjer. Moderne AI-modeller som Tacotron og WaveNet forbedrer naturligheden.

Kodeeksempel

import pyttsx3
engine = pyttsx3.init()
engine.say('Hello, world!')
engine.runAndWait()

Simpelt eksempel med pyttsx3-biblioteket.

Oprindelse

Sammensat af 'tekst', 'til' og 'tale', lånt fra engelsk 'text-to-speech'.

Afledte ord

2

Kilder

2
  • WaveNet: A Generative Model for Raw Audio (2016)
  • Tacotron: Towards End-to-End Speech Synthesis (2017)