2. Juni 2026
AI Voice Cloning

Deep Dive Workshop ElevenLabs – Voice Cloning und mehr

In diesem Workshop entdecken Sie die fortschrittlichen Funktionen von ElevenLabs, der führenden Plattform für KI-generierte Sprachtechnologie. Dieser Kurs richtet sich an alle, die ihre Fähigkeiten vertiefen und die vielfältigen Möglichkeiten von ElevenLabs umfassend nutzen möchten.

ElevenLabs ist ein führendes Unternehmen im Bereich der KI-gestützten Sprachtechnologie, das sich auf die Entwicklung natürlicher und realistischer Sprachsynthese spezialisiert hat. Das Softwareunternehmen bietet eine fortschrittliche, sogenannte “ text to speech“-Technologie an, die in der Lage ist, qualitativ hochwertige, menschenähnliche Sprache in 32 Sprachen zu generieren. Diese Technologie findet u.a. Anwendung in Bereichen wie Hörbüchern, Videospiel-Charakteren und der Unterstützung von Sehbehinderten.

Mit ElevenLabs können Benutzer aber auch ihre eigene Stimme, oder die von Sprecher:innen und Schauspieler:innen klonen und in 29 Sprachen sprechen. Diese Funktion ermöglicht also die Erstellung individueller Stimmen für verschiedene Anwendungen.

Zudem ermöglicht das Tool die automatische Übersetzung und Synchronisation von Audio- und Videoinhalten, wobei Emotion, Timing und Ton des Originalsprechers beibehalten werden. Dieses Feature  ist für die Lokalisierung von Medieninhalten besonders nützlich.

WORKSHOP-INHALTE

1. Einführung in ElevenLabs
–  Überblick über die Plattform und ihre Hauptfunktionen
–  Anwendungsbereiche und Einsatzmöglichkeiten
–  Kosten

2. Text-to-Speech (TTS) Technologie
–  Erstellung von realistischen Sprachsynthesen in 32 Sprachen
–  Anpassung von Intonation und Emotionen für verschiedene Kontexte
–  Integration von TTS in verschiedene Anwendungen

3. Voice Cloning
–  Erstellung individueller Stimmen (Voraussetzungen, Tipps und Tricks)
–  Verwendung des Voice Design Tools für maßgeschneiderte Stimmen
–  Einsatzmöglichkeiten und Beispiele

Beispiel für geklonte Stimme eines SWR3 Moderators:

4. Dubbing Studio
–  Automatische Übersetzung und Synchronisation von Audio- und Videoinhalten
–  Erhalt von Emotion, Timing und Ton des Originalsprechers
–  Anwendung in der Medien- und Unterhaltungsbranche

 

5. Projekte und Workflows
–  Erstellung von Hörbüchern und Podcasts mit ElevenLabs
–  Verwaltung und Organisation von Projekten innerhalb der Plattform
–  Best Practices für effiziente Workflows

6. Sicherheitsaspekte und ethische Überlegungen
–  Verantwortungsvoller Einsatz von KI-generierten Stimmen
–  Schutz vor Missbrauch und Implementierung von Sicherheitsmaßnahmen
–  Diskussion aktueller Herausforderungen und Lösungen

Kursmaterialien
– Alle Kursmaterialien werden im Anschluss an den Deep Dive Workshop zur Verfügung gestellt

Anmeldung und weitere Informationen

Haben wir Ihr Interesse geweckt? Dann kontaktieren Sie uns jetzt!

Michael Katzlberger

Michael Katzlberger widmet sich mit Leidenschaft dem Thema Künstliche Intelligenz in der Kreativindustrie, berät Unternehmen und gibt sein Wissen in Seminaren, Lehrveranstaltungen und Gastvorträgen im In- und Ausland weiter. Sein Schwerpunkt liegt hierbei darauf, das Thema KI zu entmystifizieren, um es EPUs, KMUs und der breiteren Öffentlichkeit besser zugänglich zu machen. 2022 gründete er 3LIOT.ai, eine hybride Kreativagentur aus Mensch und KI. Das Ziel: Die Grenzen menschlicher Kreativität zu erweitern.

Alle Beiträge ansehen von Michael Katzlberger →