11. Dezember 2023
duplex KI

Hat die Google Duplex KI gerade den Turing Test bestanden?

Der Turing Test stammt aus dem Jahr 1950, benannt nach dem britischen Mathematikgenie Alan Turing. Mit ihm soll festgestellt werden, ob eine Maschine das Denkvermögen eines Menschen hat.

Für diesen Test führt ein menschlicher Fragesteller über eine Tastatur und einen Bildschirm ohne Sicht- und Hörkontakt eine Unterhaltung mit zwei ihm unbekannten Gesprächspartnern. Ein Gesprächspartner ist ein Mensch, der andere eine Maschine. Wenn der Fragesteller nach intensivem Chat nicht klar sagen kann, welcher von beiden die Maschine ist, hat die Maschine den Turing-Test bestanden, und es wird der Maschine ein “dem Menschen ebenbürtiges” Denkvermögen zugesagt.

Turing-Test
Quelle: Wikipedia

Der Turing Test ist nicht unumstritten, so gibt es mittlerweile Alternativen wie den Lovelace-Test, bei dem eine KI Kreativität beweisen muss und den Metzinger-Test, bei dem eine KI mit eigenen Argumenten in die Diskussion um künstliches Bewusstsein eingreifen und überzeugen muss.

Seit Jahrzehnten gibt es heftige Diskussionen darüber, ob das Bestehen des Turing-Tests einen sinnvollen Durchbruch für die KI Forschung bedeuten würde. Was aber die bei der google I/O 2018 vorgestellte Google Duplex KI besonders auszeichnet, ist die exzellente Nachahmung der menschlichen Sprache. Der ursprüngliche Turing-Test ging nämlich davon aus, dass jede Diskussion zwischen Computer und Forscher in Textform stattfinden würde.

Google CEO Sundar Pichai erklärt in obigem Video, dass das, was wir hören ein echter Anruf in einem Friseursalon war. Und dieser nicht wusste, dass es Teil eines Experiments war. Er startete Duplex, indem er den Google-Assistenten bat, einen Friseurtermin für Dienstagmorgen zu buchen, die KI hat dann den Rest erledigt. Das Gespräch ist atemberaubend und beunruhigend zugleich.

Wer von ihnen Alexa, Siri und co benutzt um einen Dialog zu führen weiß, dass man hier sehr schnell an seine Grenzen stößt. Je nach Internetverbindung und Fragestellung können die Antwortzeiten sehr langsam sein, of erfasst die KI nicht einmal die Frage oder den Sprachbefehl korrekt. Die meisten KIs können maximal zwei aufeinanderfolgende Abfragen verarbeiten und benötigen praktisch alle einen Trigger wie “Alexa” oder “Hey Siri”.

Alan Turing, Begründer des Turing-Tests
Alan Turing, Begründer des Turing-Tests Quelle: Wikipedia

Der Google-Assistent, der Duplex ausführt zeigt keines dieser Probleme. Er klingt wie eine junge Assistentin, die sorgfältig Termine plant. Zusätzlich  hat Google Sprachstörungen wie verbalen Ticks –  z.B. “mm-hmms” und “ums” – Latenzen oder Pausen eingebaut, die auch in natürlicher Umgebung beim Sprechen auftreten. Das Ergebnis zeigt eine vollkommen menschliche Stimme, die vollständig von einem Computer erzeugt wird.

Duplex ist eine Weiterentwicklung des google assistant, den man auf bestimmte Gesprächssituationen trainiert hat. Derzeit kann das System, das man als “narrow KI” bezeichnen könnte nur für eine begrenzte Anzahl von Telefongesprächen nutzen. Für die Abfrage von Öffnungszeiten, Tischreservierungen in Restaurants oder Friseurtermine.

Die I/O Mega KI-Show wirft natürlich viele ethische Fragen auf, auf die auch Google noch nicht alle Antworten hat. Das gibt Technokritikern und Verschwörungstheoretikern genug Futter für die nächsten Monate. Betrugsversuche? Fake News? Alles wird möglich und vor allem für jedermann zugänglich, sobald Google die Schnittstellen öffnet.

Bei TUNNEL23 haben wir WaveNet von Google, mit dem man Stimmen über ein künstliches neuronales Netzwerk emulieren kann bereits getestet. Aktuell leider nur auf Englisch verfügbar, aber hören sie selbst:

WaveNet – Frauenstimme – TUNNEL23 Testfile:

WaveNet – Männerstimme – TUNNEL23 Testfile:

Duplex ein überzeugender Beweis dafür, dass wir uns in großen Schritten auf echte Gesprächs KIs zubewegen, wie man sie aus dem Film HER kennt. Alan Turing wäre stolz auf diese Leistung, da bin ich mir sicher.

Michael Katzlberger

Michael Katzlberger widmet sich mit Leidenschaft dem Thema Künstliche Intelligenz in der Kreativindustrie, berät Unternehmen und gibt sein Wissen in Seminaren, Lehrveranstaltungen und Gastvorträgen im In- und Ausland weiter. Sein Schwerpunkt liegt hierbei darauf, das Thema KI zu entmystifizieren, um es EPUs, KMUs und der breiteren Öffentlichkeit besser zugänglich zu machen. 2022 gründete er 3LIOT.ai, eine hybride Kreativagentur aus Mensch und KI. Das Ziel: Die Grenzen menschlicher Kreativität zu erweitern.

Alle Beiträge ansehen von Michael Katzlberger →
%d