• sharearrow
  • Facebook - Weiß, Kreis,
  • Twitter - Weiß, Kreis,
  • LinkedIn - Weiß, Kreis,

 

Alexa, was machst du grade – und wie?

Sprachassistenten gibt es heute in Millionen deutschen Haushalten. Auch wenn bereits einer von drei Deutschen sie nutzt, ist oft unklar, wie genau sie funktionieren. Dabei bieten sie viele Möglichkeiten, wenn man sie genauer kennenlernt. Und das nicht nur privat, sondern auch im Beruf. Gerade für Marketing und PR sind die Möglichkeiten groß.

Sprachassistenten – elektronische Alltagshelfer

Praktisch, einfach, schnell: So beschreiben viele Siri, Alexa und Co. Musik abspielen, eine Einkaufsliste schreiben oder den Todestag von Goethe suchen (22. März 1832) – all diese Dinge können Sprachassistenten.

Wir wissen also, was sie machen – nur wie machen sie es?

Bekannt und beliebt: Gerade jüngere Deutsche haben viel Kontakt mit Sprachassistenten.

© Postbank

Was ist was?

Am Anfang ist es wichtig, im Wust der Begriffe ein wenig Ordnung zu schaffen. Denn es gibt viele verschiedenen Namen. Doch die Systeme der Hersteller funktionieren sehr ähnlich. Grob bestehen sie immer aus einem Smart Speaker und einer Sprachsoftware mit KI, die auf einem Server des Unternehmens arbeitet. Sie kann auf riesige Datenmengen und andere Quellen zugreifen.

Smart Speaker sind die physischen Geräte, die heutzutage viele zuhause stehen haben:

  • Amazon: Echo

  • Google Home

  • Apple: HomePod / iPhone

  • Windows 10-Computer

​​

Die Sprachsoftware ist aber das eigentliche Gehirn hinter der Sache. Sie analysiert, was wir sagen und sendet die Antwort oder den Befehl. Die Namen der Software ist dabei meistens bekannter, obwohl sie gar nicht im Gerät selbst steckt. Denn

  • Alexa

  • Google Assistant

  • Siri

  • Cortana

​​

„sitzen“ alle in der Cloud.

Die Smart Speaker sind also keine Kommunikationspartner, sie sind vielmehr wie das gute alte Telefon mit Wählscheibe: Sie übermitteln die Nachricht zwischen zwei Gesprächspartnern, mehr aber auch nicht. Deshalb funktioniert Amazon Echo auch nicht, wenn das WLAN aus ist. Es nimmt nur auf und gibt wieder. Ohne Internet läuft nix.

„Echo“ von Amazon

Ein ganz normaler Tag im Leben von Alexa

Um den Arbeitsprozess von Sprachassistenten besser zu verstehen, schauen wir uns Alexa genauer an. Dabei betrachten wir die rein sprachgesteuerten Geräte, es gibt aber mittlerweile auch Geräte mit Display. Doch uns interessiert vor allem die Sprachfunktion.

Ich kann fragen: „Alexa, wie ist heute das Wetter in Mainz?“. Dann passiert folgendes:

 

1. Aktivierung

Der Smart Speaker (Bei Alexa: „Echo“, sprich „Ekko“) hört erstmal alles mit, was gesagt wird. Das ist datenschutztechnisch erstmal bedenklich. Aber dem Hersteller zufolge löscht er alles auch sofort wieder. Erst durch das Aktivierungswort „Alexa“ wird er aufmerksam. Das Gerät zeigt dies, indem es blau aufleuchtet. Der Smart Speaker ist in diesem Moment das Ohr des Sprachassistenten-Organismus (siehe Grafik).

2. Aufnahme

Das „Echo“ nimmt dann den nachfolgenden Satz auf. In unserem Fall die Frage „wie ist heute das Wetter in Mainz?“. Der Chip im Gerät filtert mögliche Hintergrundgeräusche heraus.

3. Übertragung

Anschließend wird die Aufnahme via WLAN an einen Cloud-Server gesendet. Dort „befindet“ sich Alexa. Der Cloud Server ist der Kopf, Alexa das Gehirn.

4. Übersetzung

Die Software-Routine namens „Alexa Voice Services“ übersetzt die gesprochene Aussage in Computer-Befehle. In unserem Fall erkennt sie dabei die Wörter „Wetter“, „heute“ und „Mainz“. Dadurch weiß sie, dass sie nach dem Wetter suchen muss.

5. Weiterleitung und Antwort

Jetzt hat Alexa die Frage oder den Befehl verstanden und bearbeitet ihn. Sie fragt also konkret Apps und andere Dienste an. Bei uns will sie von einer Wetter-App das Wetter in Mainz wissen. Die gibt ihr die Info, aber alles natürlich in Computer-Sprache.

6. Übersetzung und Befehl

An dieser Stelle kommt es erneut zur Übersetzung, denn die Computer-Sprache ist für uns unverständlich. Also wandelt die Alexa-Software die Antwort in menschliche Sprache und sendet sie an das „Echo“-Gerät. Das Gehirn schickt also einen Befehl an den Mund.

7. Abspielen

Den letzten Schritt übernimmt der Smart Speaker dann wieder selbst: Die Antwort von Alexa wird über das „Echo“, also den Mund, abgespielt. Jetzt wissen wir, dass es heute in Mainz sonnig bei 15 Grad sein wird.

 

Das Ganze läuft mit Aufgaben, die Alexa ausführen soll, ähnlich ab. In Wohnungen mit Smart-Home-Installationen gibt es beispielsweise Geräte, die man mit Alexa steuern kann. Sagt man „Alexa, mach das Licht an“, passiert in den ersten 5 Schritten dasselbe. In Schritt 6 geht der Befehl aber an eine Lampe, also an Gliedmaßen, in Schritt 7 schaltet die Lampe das Licht ein.

Grafik: Sprachassistenten als Organismen © Thomas Hörner

Voice Apps

Bei genauer Betrachtung entdeckt man in der Grafik noch etwas: Das Gehirn lässt sich erweitern. Dafür braucht man sogenannte „Voice Apps“.

Im Prinzip sind Voice Apps beim Sprachassistenten wie Apps auf Smartphones. Sie kommen von Drittanbietern. Amazon, Google und Co. bieten nur das „Betriebssystem“, also die Sprachsoftware. Und wie man auf dem Smartphone ohne extra Apps vieles nicht machen kann, sind auch Sprachassistenten eher eingeschränkt. Mit Voice Apps aber haben sie auf einmal viel mehr drauf.

So kann man sich für Alexa unter anderem die Voice App der Deutschen Bahn runterladen – und anschließend Alexa nach Verbindungen suchen oder Tickets kaufen lassen. Bei Alexa heißen die Voice Apps übrigens „Skills“. Google nennt sie „Actions“.

Grafik: Skills © Decypher Media

Sprachassistenten arbeiten mit Voice Apps anders:

  • Das Beispiel Alexa in der Grafik zeigt, dass nur die gesprochenen Worte verarbeitet werden (1).

  • Damit der „Skill“ aktiviert wird, muss man „Alexa, frage [Name des Skills] …“ sagen. Alexa übersetzt dann die Anfrage in Computer-Sprache und kontaktiert den Skill (2).

  • Der erkennt und bearbeitet die Anfrage und erzeugt eine Antwort, die er Alexa schickt (3).

  • Alexa wandelt die Computer-Antwort dann in menschliche Sprache und schickt sie an das Echo (4). Das Gerät spielt dann die Antwort ab.

​​

Bedeutend hierbei: Nur der Skill generiert eine Antwort. In diesem Fall ist auch die Sprachsoftware Alexa nur Übermittlerin. Es ist vergleichbar mit einem Chef, der seinen Mitarbeiter anruft (Telefon= Echo) und um eine Info bittet. Der Mitarbeiter (= Alexa) beauftragt den Praktikanten (= Skill), die Info rauszusuchen. Der gibt die Antwort an den Mitarbeiter und der über das Telefon an den Chef.

Berufsfeld Medien: Individuelle Alltagshilfe

Sprachassistenten haben offensichtlich einiges drauf. Und das ist für die Medienbranche natürlich interessant. Wie für eigentlich jedes Berufsfeld, kann eine solche Software ein hilfreicher Büroassistent sein. Infos raussuchen, eine Mail diktieren, den Kalender verwalten, etc.

Sehr bedeutend sind die Skills. Denn sie erlauben eine Individualisierung. Der Assistent wird an eigene Bedürfnisse angepasst. Wer oft die Bahn benutzt oder Termine im Kalender verwalten muss, kann entsprechende Skills installieren.

Aber besonders spannend ist die Entwicklung von Voice Apps. Jeder mit dem Know-how kann eine eigene Voice App erstellen. Oder man beauftragt einen spezialisierten Dienstleister mit der Programmierung. So könnte man einen Skill erstellen lassen, der alle Presseagenturmeldungen zu bestimmten Themen sammelt. Wenn man dann sagt, „Alexa, frage dpa was es zur Lufthansa gibt“, würde Alexa dpa-Meldungen zur Lufthansa vorlesen.

Berufsfeld Medien: Möglichkeiten in Marketing und PR

Skills bieten weitere Möglichkeiten, die für Marketing und PR spannend sind. Denn die Anbieter von Skills bestimmen selbst den Inhalt, Alexa übermittelt nur. Unternehmen können darüber Automated-Communications-Angebote erstellen. Über diesen neuen wachsenden Kanal werden dann neue und bestehende Kunden erreicht. Außerdem können Unternehmen ihre Produkte und Dienste neu und anders vermarkten.

So stellen Parfum-Skills von Douglas dem Anwender seinen persönlichen Duft-Katalog zusammen und machen Vorschläge zu passenden Ergänzungen. Der Kunde kann dann über Alexa auch direkt bestellen und einkaufen. Der Kunde spart sich die Fahrt zum Geschäft und das Unternehmen und das Unternehmen kann eventuell Fachkräfte einsparen. Für die Unternehmen könnten sich also gut entwickelte Skills als lukrativ erweisen.

 

Paul Heck

  • Facebook - Paul Heck

Neue Software statt neuer Mitarbeiter? Genauer gesagt, eine eigenständig arbeitende Software, die in den Redaktionen der Welt Leserkommentare beantwortet, Titelzeilen erstellt oder gar ganze Artikel verfasst. Was sich zuerst nach Zukunftsmusik anhört, ist bei der „Washington Post“ so normal wie der Kaffeevollautomat im Medienhaus. Deshalb heißt dort der neue Mitarbeiter ...

Unser neuer Redaktions-Kollege, der Heliograf

Wir alle sind täglich umgeben von automatisierten Prozessen, Entscheidungen und Rückschlüssen, von denen wir oft nichts mitbekommen. Um die Grundlagen von Automated Communications zu verstehen, habe ich mich mit Kai Jakobs, Anwendungsentwickler bei der IT-Firma QKom aus Koblenz getroffen.

Was sind eigentlich Algorithmen?​

Seit dem Launch der ersten Generation von Amazons Sprachassistenten Alexa 2014 wurde die Produktreihe „Echo“ weitreichend ausgebaut und es wurden bis zum Beginn letzten Jahres insgesamt über 100 Mio. Geräte mit integriertem Alexa verkauft. Alexa etabliert sich nach und nach als die Schnittstelle für automatisierte Kommunikation. Doch die Entwickler hinter der KI ...

„Alexa, was steht heute an?“ - Wie Amazon unseren Alltag lenkt

© 2020 Seminar Automated Communications