Während der jährlichen Hardware-Veranstaltung am 24.September 2020, die zum ersten Mal virtuell stattfand, kündigte Amazon auch Aktualisierungen seiner gesamten Alexa-Software-Entwicklertools und Frameworks an. Die Veranstaltung unterstrich Amazons Ambitionen, Teil des täglichen Lebens der Menschen zu werden und präsentiert Alexa mit neuen KI Features.
Die Corona-Pandemie hat die Nutzung der Alexa-Sprachplattform, die die letzten Jahre ohnehin im Aufschwung begriffen ist, noch einmal stark erhöht. Laut einer Studie von NPR und Edison Research stieg der Prozentsatz der Besitzer sprachgesteuerter Assistenten, die dem Gerät mindestens einmal pro Tag Befehle erteilen, zwischen Anfang 2020 und Anfang April deutlich. Etwas mehr als ein Drittel der Besitzer intelligenter Lautsprecher gibt an, mehr Musik, Unterhaltung und Nachrichten zu hören als zuvor. Weiters geben sie an, dieses Jahr durchschnittlich 10,8 Aufgaben pro Woche von ihrem Assistenten anzufordern, verglichen mit 9,4 Aufgaben im Jahr 2019.

Alexa wird proaktiv
In den kommenden Wochen wird Alexa ihren Nutzern proaktiv Fragen stellen, damit sie den Kontext besser zu verstehen und verarbeiten lernt. Sie wird sich dann zum Beispiel daran erinnern können, dass “Papas Lese-Modus” bedeutet, die Wohnzimmerbeleuchtung auf 80% Helligkeit einzustellen und die Klimaanlage einzuschalten. Zunächst wird diese Personalisierung für Smart-Home-Konzepte und -Aktionen angewandt, in Zukunft soll sie aber auch auf andere Bereiche ausgeweitet werden. Alexa wird demnächst auch in der Lage sein, ihre Intonation je nach Kontext zu ändern, aufbauend auf Amazons Fortschritten in der neuronalen Text-to-Speech-Technologie.
“In kommenden Monaten wird Alexa bestimmte Wörter betonen und sogar Pausen und Atemzüge einfügen” – Alexa VP und Chefwissenschaftler Rohit Prasad
Natural Turn Talking
Auch für den “Follow-Up”-Modus, der bereits 2018 eingeführt wurde wird es eine Erweiterung geben, die ab 2021 zunächst aber nur auf englisch verfügbar sein wird. Diese Funktion, die sich “Natural Turn Taking” nennt, ermöglicht es mehreren Personen gleichzeitig an Gesprächen mit Alexa teilzunehmen. Alexa wird also bald akustische, sprachliche und sogar – sofern eine Kamera im Gerät verbaut ist – visuelle Hinweise nutzen, um festzustellen, ob eine Anfrage an sie gerichtet ist. Dabei laufen gleich 3 KI Modelle im Hintergrund:
- Man unterscheidet zwischen Hintergrundgeräuschen und Kommandos, die für Alexa bestimmt sind
- Das zweite KI Modell wandelt Sprache mittels Spracherkennung in Text um, so dass dieser auf Kontext-Ebene analysiert werden kann
- Beim dritten KI-Verfahren wird das Signal einer Gerätekamera (wenn vorhanden) verwendet, um zu entscheiden, ob das gesprochene Wort an den Assistenten gerichtet ist
Tonerkennung und Alexa Guard
Alexa’s Geräuscherkennung wird ebenfalls erweitert und verbessert. So werden etwa ein weinendes Baby, bellende Hunde oder Schnarchen erkannt. Nutzern soll auch die Möglichkeit gegeben werden Routinen einzurichten, die automatisch starten, wenn Alexa eines dieser Geräusche erkennt.
Mehr als 2 Millionen Kunden haben sich seit der Markteinführung für “Alexa Guard” entschieden. Amazon erwartet, dass sich zumindest ein Teil davon für Alexa Guard Plus, ein neues Premium-Angebot, anmelden wird. Alexa Guard Plus bietet eine zusätzliche Schallerkennung, sich schließende und öffnende Türen, sowie eine 24/7-Überwachung mit Zugang zu einer Notfall-Hotline.
Alexa und der Datenschutz
Mit einem einzigen neuen Alexa-Befehl können Benutzer alles löschen, was Alexa jemals aufgezeichnet hat. Der Befehl “Alexa, lösche alles, was ich jemals gesagt habe” entfernt alle Sprachschnipsel, die mit einem Amazon-Account verbunden sind. Normalerweise behält Amazon diese Schnipsel, um Leistung von Alexa zu verbessern.
“Alexa, lösche alles, was ich jemals gesagt habe”
Darüber hinaus unterstützt Alexa jetzt Gruppen-Audio- und Videoanrufe mit bis zu acht Freunden oder Familienmitgliedern, Zoom-Anrufe und Netflix, sowie die gemeinsame Nutzung von Musik über Echo-Geräte mit dem Befehl “Alexa, share this song”.
Amazons Hardware Chef Dave Limp im Cnet Interview
Künstliche Intelligenz als Innovationstreiber
Besonders stolz sind Amazons Entwickler auf die “Natural turn talking”-Funktion. In einer inszenierten Demo sprachen zwei Freunde über die Bestellung einer Pizza durch ein Alexa-Gerät. Sie benutzten im Gespräch aber nicht die Namen des anderen, sondern hielten inne, um nachzudenken, änderten ihre Meinung und passten die Reihenfolge an und so weiter. Alexa “wusste”, wann sie sich zu Wort melden sollte, und auch, wann sie miteinander sprachen und nicht mit dem Alexa-Gerät.
Bei der Veranstaltung sagte Rohit Prasad, Vizepräsident und leitender Wissenschaftler von Alexa, dass dies “echte Erfindungen” erfordere und sein Team damit weit über die reine Verarbeitung natürlicher Sprache (NLP) hinausgegangen sei. So kam auch multisensorische KI zum Zug, es wurden akustische, sprachliche und visuelle Hinweise mit einbezogen. Diese Fortschritte in der Spracherkennung sind dem neuen AZ1 Neural Edge-Prozessor zu verdanken, der in den Assistenten verbaut ist. Der Chip ist darauf ausgelegt, maschinelle Lernanwendungen direkt auf dem Gerät zu beschleunigen und nicht in der Cloud zu verarbeiten.
Amazons Strategie – Künstliche Intelligenz mit tragender Rolle
Amazons Strategie, von der Breite in die Tiefe zu gehen, scheint voll aufzugehen. In den letzten Jahren ging es in erster Linie darum, die Echo Produkte durch Gerätepartnerschaften und preiswerte Smart Speaker in jeden Haushalt zu bringen. Jetzt will Amazon das Kundenerlebnis verbessern, indem es seine Geräte “menschlicher” und intelligenter macht. Und Künstliche Intelligenz spielt hier eine tragende Rolle.
Mehr Infos