31. März 2023

Speech Synthesis Markup Language (SSML)

Die Speech Synthesis Markup Language (SSML) ist eine vom W3C standardisierte und auf XML basierende Auszeichnungssprache, die um zusätzliche Befehle für die Sprachausgabe erweitert wurde. Hierdurch wird eine standardisierte Möglichkeit geschaffen, bestimmte Aspekte bei der Sprachsynthese, wie z. B. Lautstärke, Tonhöhe oder Sprechgeschwindigkeit zu beeinflussen.

Hier ein SSML-Beispiel:
Wenn ich möchte, dass die Pausen  - im Code als "break time" bezeichnet -  zwischen den Aufzählungen z.B. 200 Millisekunden, bzw. 1400 Millisekunden betragen, muss ich diesen einfachen SSML Code eingeben:

SSML-Sprachsynthese

Das Ergebnis hört sich gut an  - gesprochen von Google Wavenet:

Michael Katzlberger

Michael Katzlberger widmet sich mit Leidenschaft dem Thema Künstliche Intelligenz in der Kreativindustrie, berät Unternehmen und gibt sein Wissen in Seminaren, Lehrveranstaltungen und Gastvorträgen im In- und Ausland weiter. Sein Schwerpunkt liegt hierbei darauf, das Thema KI zu entmystifizieren, um es EPUs, KMUs und der breiteren Öffentlichkeit besser zugänglich zu machen. 2022 gründete er 3LIOT.ai, eine hybride Kreativagentur aus Mensch und KI. Das Ziel: Die Grenzen menschlicher Kreativität zu erweitern.

Alle Beiträge ansehen von Michael Katzlberger →