Rana el Kalioubys Software kombiniert Emotionen und künstliche Intelligenz

Think:Act Magazin “Alles auf Anfang”
Rana el Kalioubys Software kombiniert Emotionen und künstliche Intelligenz

Portrait of Think:Act Magazine

Think:Act Magazine

München Office, Zentraleuropa
11. Januar 2021

Rana el Kaliouby weiß, warum KI verstehen sollte, wie die menschlichen Emotionen funktionieren

Artikel von Steffen Heuer
Fotos von Tony Luong

Mehr zum Thema "Alles auf Anfang"

KI muss dazulernen, sagt Unternehmerin Rana el Kaliouby. Soll sie Menschen wirklich nutzen, muss sie auch deren Emotionen verstehen.

Szenen wie diese spielen sich jeden Tag millionenfach ab: Eine Autofahrerin wendet kurz ihren Blick von der Straße ab. Weil sie übermüdet ist. Oder aufgewühlt durch einen Streit. Vielleicht auch, weil sie auf ihr Smartphone schaut, um schnell eine SMS zu verschicken. Alles allzu menschliche Verhaltensweisen, die schnell zu einem Unfall führen können.

Auch Rana el Kaliouby, studierte Informatikerin und IT-Unternehmerin, hat in einem solchen Moment der Ablenkung einmal ein Auto zu Schrott gefahren. Moderne Softwaresysteme können das nicht verhindern. Sie sorgen dafür, dass wir die Spur halten oder an einer roten Ampel bremsen, aber noch immer verstehen sie menschliche Gefühle nicht. "Automatisierung und künstliche Intelligenz in der Automobilbranche konzentrierten sich in der Vergangenheit vor allem auf das, was außerhalb des Autos passiert", sagt el Kaliouby. "Der Innenraum ist noch immer eine Art Black Box."

"Traditionelle Computer haben uns trainiert zu glauben, dass wir in einer Welt leben, in der es keine Gefühle gibt."

Rana el Kaliouby

Dabei gibt es viele wichtige Informationen aus dem Innenraum, deren Analyse für mehr Sicherheit sorgen könnte: Wie viele Menschen befinden sich im Auto? Wie interagieren sie? Halten sie Gegenstände in der Hand? Sind sie aufgewühlt, müde, abgelenkt? 2009 gründete el Kaliouby das Unternehmen Affectiva, um etwas zu entwickeln, das solche Fragen beantworten kann: "Emotion AI", künstliche Intelligenz mit Gefühlen.

Computer können komplexe Berechnungen durchführen, rote Ampeln erkennen und Befehle ausführen, aber sie wurden nicht dafür gebaut, vielschichtige menschliche Interaktionen zu entschlüsseln. Menschen hingegen tun dies ständig, sagt el Kaliouby. Egal, ob sie es mit einer Maschine oder einer Social-Media-Plattform zu tun haben: Sie ignorieren, dass ihr digitales Gegenüber Stimmungen oder Gefühle nicht erkennen, geschweige denn darauf reagieren kann. "Computer haben uns trainiert, zu glauben, dass wir in einer Welt leben, in der es keine Gefühle gibt."

El Kaliouby sagt: Das können wir ändern. Genauer gesagt: Wir sollten es ändern. Denn KI, die sich auf unsere Gefühle einstellt, könnte ein dringend benötigtes Gegenmittel gegen den entmenschlichenden Effekt der Technologie sein. Gerade in einer Zeit, in der wir immer abhängiger von autonomen Fahrzeugen, Robotern und sensorbepackten Wearables werden, von virtuellen Räumen für Bewerbungsgespräche und Lerngruppen, von Algorithmen, Apps und Plattformen, die wir brauchen, um zu arbeiten oder mit anderen Menschen in Kontakt zu treten. "Technologie brauchen wir heute mehr denn je", meint el Kaliouby. Aber sie müsse anders werden. Intelligenter. Menschlicher.

Den IQ von Computern mit einem EQ zu verbinden, ist nicht nur ein berufliches Ziel von el Kaliouby, sondern auch ein zutiefst persönliches. In ihrem 2020 erschienenem Buch Girl Decoded beschreibt sie, wie sie aus einem streng muslimischen Elternhaus zur erfolgreichen Informatikerin im MIT Media Lab und schließlich Geschäftsführerin eines innovativen Technologie-Start-ups wurde. Es ist ein Weg durch die männlich dominierte Tech-Welt, in der es nur sehr wenige Programmiererinnen gibt. Und noch weniger, die ein Kopftuch tragen. Ihr Buch zeigt, dass es ihr auch darum geht, ihre eigenen Emotionen zu entschlüsseln. "Programmieren war für mich ein Prozess herauszufinden, wer ich bin und wofür ich stehe", sagt sie.

2.2% — des Risikokapitals, das 2018 in den USA investiert wurde, ging an Unternehmen, die von Frauen gegründet wurden.

El Kaliouby wurde 1978 in Kairo geboren. Als Tochter einer konservativen Familie, die später nach Kuwait zog. Sie war eine glänzende Schülerin und erhielt ein Stipendium an der University of Cambridge, wo sie ihre Berufung entdeckte: die Informatik. "Ich war nicht von den Schrauben und Muttern fasziniert, sondern davon, wie Technologie die Art und Weise verändern kann, in der Menschen kommunizieren", sagt el Kaliouby. Sie erinnert sich genau an den Moment, in dem ihr klar wurde, wie ein gewöhnlicher Computer menschliche Interaktion beschränkt.

Es war ein Winternachmittag in Cambridge, lange bevor Webcams und Smartphones allgegenwärtig wurden. El Kaliouby unterhielt sich mit ihrem damaligen Ehemann in Ägypten – indem sie Worte auf eine Tastatur tippte. Plötzlich wurde ihr klar, dass ihr Computer keine Ahnung davon hatte, wie schlecht es ihr in diesem Moment ging, obwohl sie doch so viele Stunden mit ihm verbrachte. "90 % der menschlichen Kommunikation funktioniert nonverbal – über Gesichtsausdruck, Stimme, Körpersprache und Gesten. All das geht online verloren. Mir wurde klar, dass wir Technologie so umgestalten müssen, dass sie diese Kommunikation mit einbezieht."

Das war Auslöser für el Kaliouby, ihre Masterarbeit über Gesichtserkennungsdetektoren zu schreiben. Daraus ging eine Doktorarbeit über Computer Vision und maschinelles Lernen hervor. Am Media Lab des MIT setzte sie ihre Forschung im Bereich der Emotionserkennung fort, zunächst mit dem Ziel, Menschen mit Autismus zu helfen. In der MIT-Professorin Rosalind Picard, die 1997 den Begriff "affective computing" geprägt hatte, fand el Kaliouby eine Gleichgesinnte und Mentorin. Gemeinsam gründeten sie 2009 Affectiva.

Please accept marketing-cookies to watch this video.
$50 mio — Risikokapital erhielt Affectiva zwischen 2009 und 2019.

Das Wort "Emotion" vermieden sie anfangs bewusst, weil sie befürchteten, dass es in der männlich geprägten Tech-Welt nicht gut ankommen würde. Ihr erster Testballon war Affdex – eine Software, die herausfinden sollte, welche Gefühle Werbeclips, TV-Shows oder Trailer von Spielfilmen auslösten, indem sie gefilmte Reaktionen des Publikums auswertete. Dies war zwar nicht der Einsatz für medizinische Zwecke, der el Kaliouby ursprünglich vorgeschwebt hatte, dafür aber kommerziell ein großer Erfolg. Nach Unternehmensangaben nutzen derzeit mehr als 100 der Fortune-Global-500-Unternehmen in 90 Ländern Affdex, darunter Mars, Kellogg's und CBS.

Durch einen TED-Talk mit dem Titel "This app knows how you feel – from the look on your face" wurde el Kaliouby 2015 einem großen Publikum bekannt. Aufgrund des Zuspruchs, den sie im Anschluss erhielt, führte sie den Begriff "Emotion AI" ein. Prompt kamen Anfragen von Autobauern: "Kann man diese Technologie auch in Autos einsetzen?" Also hörte sich Affdex Mitschnitte von Kundentelefonaten auf Englisch, Deutsch und Chinesisch an. Die Software sollte nicht einzelne Worte erkennen, sondern wie schnell und wie laut die Menschen redeten, ob sie monoton sprachen oder ob Tonhöhe und Betonung variierten, was ein Zeichen für Aufregung ist.

Das Ergebnis war "In-Cabin Sensing", ein System, bei dem Kameras und Mikrofone Fahrer und Fahrgäste aufzeichnen. Zu den Nutzern gehören BMW und Porsche, der Automobilzulieferer Aptiv und führende Unternehmen im Bereich des autonomen Fahrens wie der Chiphersteller Nvidia.

Unsere Muskeln verraten uns: So erkennt KI, was wir fühlen

Für IT-Spezialisten ist ein Gesicht nichts weiter als ein Gewirr aus Muskeln, das man scannen, entwirren und Gefühlszuständen zuordnen kann. Die Psychologen Paul Ekman und Wallace Friesen lieferten die wissenschaftliche Basis dafür. 1970 entwickelten die beiden Wissenschaftler das Facial Action Coding System (FACS), das 43 Muskeln, die sich unterhalb der Gesichtshaut befinden, kartiert und 46 grundlegende Muskelbewegungen kategorisiert – unbewusste Veränderungen des Gesichtsausdrucks, wie eine hochgezogene Augenbraue oder eine geschürzte Lippe. Diese Muskelbewegungen korrespondieren mit unterschiedlichen Gemütszuständen. Ekman konnte mithilfe dieses Systems sechs grundlegende Emotionen bestimmen: Ärger, Ekel, Angst, Freude, Überraschung und Trauer. Später kam Verachtung hinzu.

Die Erkenntnisse von Ekman und Friesen bilden das Fundament für die Software von Affectiva, dem Unternehmen, das Rana el Kaliouby zusammen mit ihrer MIT-Kollegin Rosalind Picard 2009 gründete. El Kaliouby – Picard hat das Unternehmen 2013 verlassen – geht jedoch davon aus, dass Software in der Lage ist, wesentlich feinere Nuancen zu erkennen. Affectiva nutzt Deep Learning, Computer Vision, Spracherkennung und mehr als 9,8 Milliarden Bilder von Gesichtern aus 90 verschiedenen Ländern, um FACS zu erweitern. Das Ziel ist eine KI, die Hunderte von verschiedenen Gemütszuständen auseinanderhalten kann.

"Lasst uns Technik menschlich machen, bevor sie uns entmenschlicht."

Rana el Kaliouby

Inzwischen beschäftigt Affectiva 90 Mitarbeiter in Boston und Kairo und besitzt die nach eigenen Angaben weltweit größte "Emotionsdatenbank", bestehend aus mehr als 9,8 Millionen Gesichtern und 4 Milliarden Einzelbildern aus Videos. Das Material stammt aus 90 verschiedenen Ländern, denn Diversität und Inklusion war el Kaliouby von Anfang an wichtig. "Eine europäische Autofirma schickte uns einen Datensatz mit lauter Gesichtern von blauäugigen, blonden Männern mittleren Alters. Wir entgegneten: Wenn unsere Technologie nicht auch mit dunkelhäutigen Menschen wie mir oder anderen Menschen funktioniert, die Diversität repräsentieren, ist das aus geschäftlicher und ethischer Sicht ein grandioser Fehlschlag."

Autos mit einem EQ auszustatten, ist nur ein möglicher Einsatzbereich ihrer Technologie. Ganz besonders seit die Coronakrise die Interaktion von Mensch zu Mensch beeinträchtigt. "Technologien wie unsere werden für Videokonferenz- oder Livestreaming-Plattformen verwendet werden", sagt el Kaliouby. Dann erhielten nicht nur Menschen, die beispielsweise eine virtuelle Präsentation halten, eine unmittelbare Rückkopplung, sondern auch die anderen Teilnehmer. "Wenn der Algorithmus die Reaktionen von allen erfasst, vermittelt das jedem Einzelnen das Gefühl, etwas beizutragen."

El Kaliouby wünscht sich, dass emotionale KI auch in anderen Bereichen eingesetzt wird, um "uns zu glücklicheren, gesünderen und einfühlsameren Menschen zu machen". So könnten etwa Roboter anstelle von Pflegern oder Krankenschwestern die Ersterfassung in Krankenhäusern durchführen und nur diejenigen zu einem Arzt schicken, die weiter behandelt werden müssen. "Es gibt Hinweise darauf, dass es 'Biomarker' in Mimik und Stimmlage gibt, die auf Dinge wie Depression, Stress, Angstzustände oder Parkinsonerkrankungen hindeuten. Wenn wir schon stunden- und tagelang auf einen Bildschirm starren, könnten wir wenigstens herausfinden, in welchem mentalen und emotionalen Zustand sich unser Gesprächspartner befindet."

Der Einsatz besserer KI-Tools könnte auch Bewerbungsverfahren verbessern. Algorithmen können Gespräche mit Bewerbern führen, ohne sich durch Geschlecht, ethnische Zugehörigkeit, Alter oder Aussehen beeinflussen zu lassen. Stattdessen könnten sie sich auf die nonverbale Kommunikation konzentrieren, um herauszufinden, ob jemand gut ins Unternehmen passt. Auch Online-Lernsysteme ließen sich durch eine KI mit emotionalem Gespür verbessern; so könnten Pädagogen unmittelbar erkennen, wie gut sie einzelne Schüler erreichen und ihre Vorgehensweise entsprechend anpassen. Aber KI-Systeme, die noch intelligenter sind und auf menschliche Emotionen reagieren können, beinhalten auch schwerwiegende Risiken.

Der Historiker Yuval Noah Harari hat drei Bücher über die Probleme geschrieben, die sich aus der digitalen Analyse menschlicher Emotionen ergeben. In einem Interview sagte er: "Einen Menschen zu hacken bedeutet, zu verstehen, was in seinem Inneren geschieht, in seinem Körper, seinem Gehirn und seinem Geist. So kann man vorhersagen, was er tun wird. Die Algorithmen müssen dafür noch nicht einmal perfekt sein, sondern nur besser als ein durchschnittliches menschliches Gehirn." Auch die im April 2019 vorgestellten "Ethikrichtlinien für vertrauenswürdige KI" der Europäischen Union sprechen diese Gefahren an.

Rana el Kaliouby

ist Mitgründerin und CEO von Affectiva, einer Ausgründung des MIT Media Lab. Sie stand auf der Forbes-Liste von "America’s Top 50 Women In Tech" und gehörte 2018 zu den "40 under 40" des Fortune Magazine.

El Kaliouby räumt ein, dass der großflächige Einsatz von emotionaler KI Eingriffe in Privatsphäre, Manipulation und Diskriminierung ermöglichen können. "Darum setzen wir unsere Technologie nicht für Lügendetektoren oder in Bereichen wie Sicherheit und Überwachung ein, obwohl wir damit wahrscheinlich viel Geld verdienen könnten. Generell schließen wir Verwendungen aus, die potenziell Menschen Schaden zufügen können oder bei denen Menschen nicht die Möglichkeit bekommen, ihr Einverständnis zu erklären." Darum ist Affectiva auch Mitglied der "Partnership on AI to Benefit People and Society", das rund 100 Mitglieder aus Industrie, Wissenschaft und NGOs aus 13 Ländern umfasst, darunter Amnesty International und die American Civil Liberties Union.

El Kaliouby wünscht sich ein Siegel für technische Produkte und Dienstleistungen, das Verbrauchern zeigt, ob die zugrunde liegende KI ethischen Anforderungen entspricht – so wie Bio-Labels auf Lebensmitteln. "Junge Menschen, die einmal Entscheider werden, müssen lernen, welche unbeabsichtigten Auswirkungen KI mit sich bringen kann. Lasst uns die Technik menschlich machen, bevor sie uns entmenschlicht."

Mehr Beiträge aus der aktuellen Ausgabe
Mehr
Portrait of Steffan Heuer
Steffan Heuer
Steffan Heuer arbeitet als Redakteur für europäische und US-amerikanische Publikationen, unter anderem für das deutsche Wirtschaftsmagazin brand eins. Geboren in München, studierte er Geschichte und Volkswirtschaft an der Freien Universität Berlin und der Tulane University New Orleans.
Portrait of Think:Act Magazine

Think:Act Magazine

München Office, Zentraleuropa