Alexa, Siri und Cortana gehören nicht etwa zu den Top10 der beliebtesten Vornamen für Kinder. Nein, sie sind intelligente Voice-Assistenten, mit denen wir das Internet per natürlicher Sprache bedienen können. Bildschirmloses Internet sozusagen. Ob Suchanfrage im Netz oder das Abspielen von Songs: Die Spracherkennungssoftware ist mittlerweile so gut, dass sie uns den Alltag einfacher macht. Und das mit Erfolg. Wir erleben gerade einen Wechsel von Smartphone-Nutzung zu sprachgesteuerten Geräten, weil wir deutlich schneller sprechen als tippen. Manchmal auch schneller sprechen als denken – aber das ist ein anderes Thema.
Voice-Assistenten und der Wunsch nach menschenähnlichem Dialog
Gerade im Auto sind zwei freie Hände mehr als praktisch. Was erklärt, warum jeder zweite Deutsche über smarte Voice-Assistenten mit elektronischen Geräten in einen menschenähnlichen Dialog treten möchte. Das zeigen die Ergebnisse des Trend Index 2018 der electronica-Messe, die unsere Technology-Kollegen Mitte November in München besucht haben. Rund 60 Prozent der 7.000 befragten Verbraucher befürworten, dass elektronische Geräte durch intelligentes Lernen vielseitiger werden.
Astronauten-Assistent im All
Voice-Assistenten sind vielseitig einsetzbar. Nehmen wir zum Beispiel CIMON, ein Roboter, ausgestattet mit künstlicher Intelligenz, der derzeit als Astronautenassistent auf der Internationalen Raumstation (ISS) im Einsatz ist. Er kann sehen, hören, verstehen und sprechen – und soll die Astronauten bei ihrer Arbeit unterstützen, sowie bei Routineaufgaben entlasten. Erschaffen hat den kunstliebenden Veganen-Roboter in Gestalt einer Lichtkugel ein mehrköpfiges Projektteam unterschiedlicher Firmen. Vorbild für die kleine Lichtkugel war übrigens Professor Simon Wright aus der Zeichentrickserie Captain Future: ein „fliegendes Gehirn“ mit Sensoren, Kameras und einem Sprachprozessor.
Missverständnisse und andere Kontextprobleme
Damit ein Sprachassistent – zumindest auf der Erde – überhaupt funktioniert, ist eine aktive Online-Verbindung notwendig. Die Sprachbefehle werden aufgenommen, in ein speziell komprimiertes Format codiert und an die jeweiligen Server hinter dem Dienst übermittelt. Diese Server-Farmen werten die übertragenen Daten aus und senden die passende Antwort an die Geräte zurück. Je nach genutztem Algorithmus ist die Erkennung der Wörter mehr oder weniger genau. Eine klare, deutliche Aussprache der Frage oder des Befehls ist an dieser Stelle also durchaus von Vorteil. Denn noch haben Alexa und Co. neben dem rein akustisch, phonetischen Verstehen ab und zu Schwierigkeiten, Kontexte zu interpretieren. Oder sie missverstehen die Absicht hinter bestimmten Suchen. So antwortete eine Sprachbox auf den Befehl eines englischen Kindergartenkindes „Play Digger Digger“ nicht mit dessen Lieblingslied, sondern mit unanständigen Begriffen und ein Nachrichtensender löste versehentlich eine Massenbestellung von Puppenhäusern aus.
Herausforderungen und Chancen des bildschirmlosen Internets
Auch das Marketing muss sich vor dem Hintergrund des bildschirmlosen Internets neu erfinden – ohne Bildschirm gibt’s nämlich auch keine Bannerwerbung mehr. Alexa und Co. sind darauf vorbereitet und verwandeln sich sekundenschnell in Produktberater für die nächste Schuh-Shoppingtour oder springen auf aufmerksamkeitsstarke Kampagnen an. So brachte ein amerikanisches Burger-Unternehmen mit einem ausgestrahlten Werbespot Sprachassistenten dazu, den Begriff Whopper für den Zuhörer schmackhaft zu umschreiben. Die Voice-Assistenten haben auch durchaus einen eigenen Kopf und legen schon mal ein anderes Produkt in den Warenkorb, als eigentlich gewünscht war. Natürlich nur als Produktempfehlung. Nicht wundern also, wenn Alexa und Co. für dich demnächst Reiswaffeln statt Schokolade shoppen.
Übrigens:
Im Jahr 2002 war der Name Alexa tatsächlich in den Top 100 der beliebtesten Mädchennamen Deutschlands. Das heißt, die Mädels sind heute 16 und werden ihre Eltern verfluchen.