Die Speech Synthesis Markup Language (SSML) ist eine vom W3C standardisierte und auf XML basierende Auszeichnungssprache, die um zusätzliche Befehle für die Sprachausgabe erweitert wurde. Hierdurch wird eine standardisierte Möglichkeit geschaffen, bestimmte Aspekte bei der Sprachsynthese, wie z. B. Lautstärke, Tonhöhe oder Sprechgeschwindigkeit zu beeinflussen.
Hier ein SSML-Beispiel:
Wenn ich möchte, dass die Pausen - im Code als "break time" bezeichnet - zwischen den Aufzählungen z.B. 200 Millisekunden, bzw. 1400 Millisekunden betragen, muss ich diesen einfachen SSML Code eingeben:
Das Ergebnis hört sich gut an - gesprochen von Google Wavenet: