• sharearrow
  • Facebook - Weiß, Kreis,
  • Twitter - Weiß, Kreis,
  • LinkedIn - Weiß, Kreis,

Wie Audrey zu Alexa wurde

Alexa, mach das Licht aus! Siri, wie wird das Wetter morgen? Heute ist es völlig normal mit technischen Geräten zu sprechen und eine Antwort von diesen zu erhalten. Doch wie weit war der Weg dorthin? Und welche Intension hatten die Erfinder dabei? Die Entstehungsgeschichte bis zu den heutigen kommunizierenden Geräten begann bereits vor rund 60 Jahren.

Wann genau begonnen wurde mit künstlicher Intelligenz zu experimentieren, ist schwer zu sagen. Als Geburtsstunde wird oft das Dartmouth Summer Research Project on Artificial Intelligence genannt – ein sechswöchiger Workshop, bei dem der damalige Forschungsstand gesammelt und zusammengefügt werden sollte. Die Eröffnung fand am 13. Juli 1956 statt. An diesem Projekt nahm auch John McCarthy teil. Ihm wird zugeschrieben im Rahmen dessen, den Begriff „artificial intelligence” (künstliche Intelligenz) geprägt zu haben.

Zu Beginn der Forschung mit Künstlicher Intelligenz waren Spiele mit leichten und gut beschreibbaren Regeln beliebt, zum Beispiel Schach. Es beruht auf einfachen und logischen Handlungsmöglichkeiten. Es besitzt jedoch unendlich viele Spielzüge.

Auch das Bilden von logischen Sätzen ist in unendlich vielen Varianten möglich. Doch erfolgt dies nicht nach dem immer gleichen Prinzip. Daher ist es wesentlich komplizierter, Computern das Sprechen beizubringen als das Schachspielen. Aus diesem Grund haben Forschende mit kleinen Schritten angefangen, bis sie bei der heutigen Sprachtechnologie angekommen sind.

Von Audrey bis zur Shoebox

Audrey war das erste System, das 1952 per Spracheingabe die Zahlen eins bis zehn erkennen konnte. Allerdings war das nur mit langen Pausen dazwischen möglich.

Shoebox: Bildinhaber IBM

(mit freundlicher Genehmigung)

1962 brachte das US-amerikanische IT-Unternehmen IBM eine weitere Spracherkennungsmaschine auf den Markt. Sie erkannte immerhin 16 Worte. Es waren die Zahlen von Null bis Neun, sowie die mathematischen Anweisungen minus, plus, subtotal, total, false und of. Die Maschine konnte die gesprochene Rechenaufgabe korrekt lösen und das Ergebnis auf einem Bildschirm darstellen. Diese Erfindung nannte sich Shoebox, da sie sehr klein war und aussah wie ein Schuhkarton.

Ihr Erfinder war der Ingenieur William C. Dersch. Ihn reizte die Vorstellung, dass Spracherkennungsmaschinen bis zu 10.000 Wörter verstehen werden. So würden sie Menschen, einfache aber lästige (Rechen-)Aufgaben abnehmen.

 

Sein Wunsch wurde erfüllt, denn an der Carnegie Mellon University entwickelte man die Shoebox so weiter, dass sie im Jahr 1976 tausend Wörter verstand und vier Jahre später die zehnfache Menge. Dies entspricht dem Sprachschatz eines Dreijährigen. Für damalige Verhältnisse eine Sensation.

Der psychologische Chatbot

Im Zeitraum von 1964 bis 1966 entwickelte Joseph Weizenbaum in den USA den ersten Chatbot. Er nannte ihn ELIZA. Der Name geht zurück auf die Blumenverkäuferin Eliza Doolittle in George Bernard Shaws Schauspiel Pygmalion. In der Geschichte wird Eliza beigebracht, akzentfrei und ohne Dialekt zu sprechen. Ihre Sprache wurde sozusagen verbessert.

 

Weizenbaums ELIZA ist jedoch auf die psychologische Betreuung einer Person spezialisiert. Das heißt, sie reagiert nur auf bestimmte Schlüsselwörter und gibt Antworten, die diesen Schlüsselwörtern zugeordnet sind. Noch heute gibt es die Möglichkeit, ELIZA zu testen.

In seinem Buch „Die Macht der Computer und die Ohnmacht der Vernunft“ begründet Weizenbaum, warum er sich für die Rolle des Psychologen entschieden hat: „Ein solcher Therapeut ist verhältnismäßig leicht zu imitieren, da ein Großteil seiner Technik darin besteht, den Patienten dadurch zum Sprechen zu bringen, dass diesem seine eigenen Äußerungen wie bei einem Echo zurückgegeben werden.“

 

Da die Menschen in den 1960er Jahren in diesem Bereich der Technologie noch unerfahren waren, ließen sie sich in Experimenten davon täuschen und hielten die Antworten für real. Das Programm verbreitete sich in den USA und wurde in weiten Kreisen zum Spielzeug. Einige praktizierende Psychiater glaubten sogar daran, dass das Computerprogramm mit weiterer Entwicklung klinisch eingesetzt werden könne.

 

Weizenbaum selbst hatte nicht mit diesem großen Interesse gerechnet. Sein Ziel war es lediglich, zu zeigen, wie sich menschliche Sprache formalisieren und digital verarbeiten lässt.

Eine Phase der Forschung und Findung

In der Science-Fiction-Welt gab es immer schon sprechende Maschinen. Unvergesslich die TV-Serie Raumschiff Enterprise, in der Captain Kirk bereits mit seinem Bordcomputer sprach. Oder der sprechende Computer HAL 9000 aus dem Film 2001: Odysee im Weltraum. Beide erschienen Ende der 1960er Jahre.

Dies lässt darauf schließen, dass die Menschen früh schon von der Vorstellung fasziniert waren, mit Maschinen zu sprechen. Übrigens: Auch David Limp, Erfinder von Amazons Alexa, bestätigt diese Assoziation in einem Interview: „Meine Vision von Alexa und Echo ist, der „Star Trek“-Computer zu sein und einfach alles beantworten zu können.“

 

In den nächsten Jahrzehnten fokussierte sich die Forschung nicht mehr nur auf die Erkennung einzelner Worte. Man ermittelte die Wahrscheinlichkeit von vorkommenden Wortfolgen. Beispielsweise ist die Folge „Ich putze mir die Nase“ wahrscheinlicher als „Ich putze mir die Vase“. So näherte man sich immer weiter der heutigen Technologie. Allerdings dauerte es noch einige Jahre, bis eine bahnbrechende Erfindung den Markt eroberte.

Der Durchbruch der Sprachassistenten

Im Oktober 2011 war es soweit – Apple präsentierte bei der Vorstellung des neuen iPhone 4S die Sprachfunktion Siri. Die von Apple gekaufte Firma Siri Inc. gründete sich bereits 2007. Dort hatte man eine App entwickelt, die sich noch nicht mit reiner Sprache aktivieren ließ. Man musste zuerst auf einen Button klicken, bevor man mündlich Fragen stellen konnte. Die Antwort kam in schriftlicher Form. Da die App mit Bing und Google Maps verbunden war, erhielt man Antworten auf die Frage nach dem nächsten Restaurant oder Events am Wochenende.

04 Good to know - Listen 2014.jpg

Zum Verkaufsstart des iPhone 4S beherrschte Siri die Sprachen Deutsch, Englisch und Französisch. Die Sprachfunktion musste jedoch ebenfalls erst noch über einen Button aktiviert werden. Ziel der Entwickler war es, einen Sprachassistenten „mit Charakter“ zu entwickeln. Dies erreichten sie dadurch, dass Siri auch auf „Scherzfragen“ antwortet. Seit 2015 kann Siri ohne „Klick“ per Sprachbefehl aktiviert werden. Mittlerweile beherrscht sie über 20 verschiedene Sprachen.

Nur wenige Jahre später beginnt das Zeitalter des Smarthome: Alexa erobert unsere Wohnzimmer. Der Name geht übrigens zurück auf die berühmte Bibliothek in Alexandria.

Aus Strategie-Gründen war Alexa im November 2014 zunächst nur für Amazon-Prime-Kunden erhältlich, ein halbes Jahr später für alle Kunden in den USA. Erst im Oktober 2016 begann der Verkauf in Deutschland.

Es dauerte nicht lange bis Google mit Google Home nachzog. Jedoch sind sich die beiden Geräte sehr ähnlich, sodass man nicht direkt von einem Fortschritt sprechen kann. Sie repräsentieren derzeit im Bereich der sprachgesteuerten KI den aktuellen Stand der Entwicklung.

Ein Blick auf den Zeitstrahl verrät, wie dynamisch sich diese Technologie gerade in den vergangenen zehn Jahren entwickelt hat. Angefangen mit einem schachspielenden Computer, über einen einfachen Chatbot bis hin zu sprechenden Säulen, die alle Fragen beantworten. Aufgrund der globalen Datenexplosion und der Intensität, mit der die Weiterentwicklung dieser Systeme vorangetrieben wird, darf man gespannt sein, was die Zukunft bringt.

 

Carolin Stöckl

Das knuffige SWR3-Maskottchen, der Elch, wird smart. Zumindest ist das der Plan des Teams hinter dem SWR3-Elchbot, der den Hörern auf Knopfdruck individuelle und stets aktuelle Stauinfos, Witze und Programminfos liefern soll. Dafür wurde das Projekt 2019 sogar für den Radiopreis in der Kategorie „Beste Innovation“ nominiert. Aber lohnt sich der neue Service überhaupt? Dieser Frage widme ich mich in einem mehrwöchigen Selbsttest.

Ist der SWR3-Elchbot ein röhrender Erfolg?

Seit dem Launch der ersten Generation von Amazons Sprachassistenten Alexa 2014 wurde die Produktreihe „Echo“ weitreichend ausgebaut und es wurden bis zum Beginn letzten Jahres insgesamt über 100 Mio. Geräte mit integriertem Alexa verkauft. Alexa etabliert sich nach und nach als die Schnittstelle für automatisierte Kommunikation. Doch die Entwickler hinter der KI ...

„Alexa, was steht heute an?“ - Wie Amazon unseren Alltag lenkt

Im Zeitalter der Digitalisierung übernehmen zunehmend Roboter die täglichen Aufgaben des Menschen. Kochen, putzen, Rasen mähen. Auch im Journalismus tauchen Roboter auf. Doch was genau ist eigentlich Roboterjournalismus? Wo nahm er seinen Ursprung? Und welche Anbieter gibt es heutzutage – in den USA aber auch in Deutschland?

Die Geschichte des Roboterjournalismus

© 2020 Seminar Automated Communications