Speech Synthesis Markup Language (SSML)

Die Speech Synthesis Markup Language (SSML) ist eine vom W3C standardisierte und auf XML basierende Auszeichnungssprache, die um zusätzliche Befehle für die Sprachausgabe erweitert wurde. Hierdurch wird eine standardisierte Möglichkeit geschaffen, bestimmte Aspekte bei der Sprachsynthese, wie z. B. Lautstärke, Tonhöhe oder Sprechgeschwindigkeit zu beeinflussen.

Hier ein SSML-Beispiel:
Wenn ich möchte, dass die Pausen  - im Code als "break time" bezeichnet -  zwischen den Aufzählungen z.B. 200 Millisekunden, bzw. 1400 Millisekunden betragen, muss ich diesen einfachen SSML Code eingeben:

SSML-Sprachsynthese

Das Ergebnis hört sich gut an  - gesprochen von Google Wavenet:

Michael Katzlberger ist Gründer und Geschäftsführer von TUNNEL23, einer der führenden, unabhängigen Agenturen für digitale Werbung in Österreich. Seit den 90er Jahren beschäftigt er sich in erster Linie mit innovativen Projekten zur Weiterentwicklung digitaler Werbeformen, insbesondere im Online und Mobile Bereich sowie Artificial Intelligence in der Kreativbranche.