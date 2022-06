Künstliche Intelligenz – Amazon will die Stimmen von Verstorbenen erhalten Der Internetkonzern will seine Alexa-Lautsprecher mit individuellen Stimmen ausstatten. Das kommt nicht überall gut an. Helmut Martin-Jung Anhören Merken Teilen Feedback

Rohit Prasad meinte es doch bloss gut. Der Leiter und Chef-Wissenschaftler von Amazons Geschäft mit den quasselnden Alexa-Lautsprechern wollte ein besonders, nun ja, sprechendes Beispiel dafür geben, was künstliche Intelligenz (KI) mittlerweile leisten kann. Also liess er in einem sentimentalen Video einem Jungen etwas aus dem Buch «Der Zauberer von Oz» vorlesen – und zwar mit der Stimme von dessen Grossmutter. KI könne zwar nicht den Verlust eines geliebten Menschen wieder gutmachen, aber doch die Erinnerung an ihn wachhalten, schickte er noch voraus.

Die PR-Geschichte ging allerdings eher nach hinten los. Prasad musst nachschieben, dass es ja nur darum gegangen sei, einen technologischen Erfolg zu präsentieren. Und die Grossmutter, fügte er hinzu, lebe übrigens auch noch.

Eine kurze Tonaufnahme von einer Minute reicht

Tatsächlich ging bei der Präsentation auf einer Amazon-Hausmesse der Technik-Aspekt etwas unter. Dass man mit KI Stimmen und sogar Videobilder von Menschen ziemlich gut imitieren kann, ist nicht neu. Neu ist, dass die Amazon-Wissenschaftler es nach eigener Darstellung geschafft haben, die Stimme eines Menschen mit Aufnahmen von weniger als einer Minute Dauer nachzuahmen. Bisher mussten dafür Stunden an Text eingelesen werden. Das, sagen Kritiker, öffne Missbrauch Tür und Tor – Enkeltrick 2.0 sozusagen.

Fähigkeiten wie diese werden künftig weit verbreitet sein. Noch sind die digitalen Assistenten wie Apples Siri oder der Assistant genannte digitale Helfer von Google vor allem für einfache Fragen geeignet, etwa: «Wie wird das Wetter morgen?» Doch die Firmen denken längst weiter. Amazon etwa will auch längere Konversationen abseits festgelegter Themen ermöglichen, etwa um über bestimmte Fragen zu informieren – was natürlich die Frage aufwirft, wer dann darüber wacht, ob das auch stimmt, was die nette Stimme aus dem Lautsprecher da so erzählt.

Microsoft waren Gesichtsausdrücke zu kompliziert

Ausserdem will der Konzern berücksichtigen, wie die Nutzer gerade drauf sind. Prasad und seinen Leuten ist durchaus klar, dass das dem heiligen Gral schon ziemlich nahekommt. «Wenn Sie heimkommen und nicht gut aufgelegt sind, ist es schwer zu sagen, was man da machen soll. Jemand, der Sie kennt, wird womöglich anders reagieren. Da liegt die Latte für die KI schon sehr hoch», sagte Prasad dem Fachmagazin «Techcrunch», «aber man kann es auch nicht ignorieren.»

Wie diffizil die Sache ist, zeigt das Beispiel von Microsoft. Der Technologiekonzern hat jüngst bekannt gegeben, den Verkauf eines Produkts zu stoppen, das aus Gesichtsausdrücken auf die dahinterliegenden Emotionen schliessen sollte. Es sei einfach zu kompliziert, begründete das Unternehmen die Entscheidung, das über Länder und Demographien hinweg zu verallgemeinern.

