2. Dezember 2021

Speech Synthesis Markup Language (SSML)

Die Speech Synthesis Markup Language (SSML) ist eine vom W3C standardisierte und auf XML basierende Auszeichnungssprache, die um zusätzliche Befehle für die Sprachausgabe erweitert wurde. Hierdurch wird eine standardisierte Möglichkeit geschaffen, bestimmte Aspekte bei der Sprachsynthese, wie z. B. Lautstärke, Tonhöhe oder Sprechgeschwindigkeit zu beeinflussen.

Hier ein SSML-Beispiel:
Wenn ich möchte, dass die Pausen  - im Code als "break time" bezeichnet -  zwischen den Aufzählungen z.B. 200 Millisekunden, bzw. 1400 Millisekunden betragen, muss ich diesen einfachen SSML Code eingeben:

SSML-Sprachsynthese

Das Ergebnis hört sich gut an  - gesprochen von Google Wavenet:

Michael Katzlberger

Michael Katzlberger war von 2001-2021 Geschäftsführer von TUNNEL23, einer der führenden, meistausgezeichneten digitalen Kreativagenturen in Österreich. Seit 2016 widmet sich Katzlberger intensiv dem Thema Künstliche Intelligenz in der Kreativindustrie, berät Unternehmen und gibt sein Wissen in Seminaren, Lehrveranstaltungen und Gastvorträgen im In- und Ausland weiter. Sein Schwerpunkt liegt hierbei darauf, das Thema KI zu entmystifizieren, um es EPUs, KMUs und der breiteren Öffentlichkeit besser zugänglich zu machen.

Alle Beiträge ansehen von Michael Katzlberger →