Jemand postet auf reddit von einer KI generierte Fotos, auf denen Menschen aus verschiedenen Epochen in einem simulierten Selfie zu sehen sind. Auffällig dabei: Alle lächeln. Und das ist ein Problem.
There are 18 images in the Reddit slideshow and they all feature the same recurring composition and facial expression. For some, this sequence of smiling faces elicits a sense of warmth and joyousness, comprising a visual narrative of some sort of shared humanity […] But what immediately jumped out at me is that these AI-generated images were beaming a secret message hidden in plain sight. A steganographic deception within the pixels, perfectly legible to your brain yet without the conscious awareness that it’s being conned. […] Why do you smile the way you do? A silly question, of course, since it’s only “natural” to smile the way you do, isn’t it? It’s common sense. How else would someone smile?
How we smile, when we smile, why we smile, and what it means is deeply culturally contextual.
Die KI, die die Fotos generiert hat, wurde offenbar hauptsächlich mit Fotos aus dem amerikanischen Kulturkreis, wo Lächeln gängig ist, trainiert. Sie überträgt diese Kultur allerdings auf andere – und schafft (oder unterstützt) damit eine falsche Wahrnehmung anderer Kulturen.
Im Medium-Beitrag gibt es, scrollt man etwas hinunter, einen Vergleich zwischen von der KI generierten Bildern und ähnlichen, aber tatsächlich aufgenommenen Fotografien. Körperhaltung, Positionierung und eben auch Mimik sind teilweise gänzlich anders. Aus der Beobachtung resultiert dann eine, ja, ich denke, man kann es so formulieren, existentielle Frage:
In the same way that English language emotion concepts have colonized psychology, AI dominated by American-influenced image sources is producing a new visual monoculture of facial expressions. As we increasingly seek our own likenesses in AI reflections, what does it mean for the distinct cultural histories and meanings of facial expressions to become mischaracterized, homogenized, subsumed under the dominant dataset? […] In the future, how will we know how to be who the algorithm doesn’t show us we can be? Would we even dare to want to? And what would that kind of totalizing assimilation mean for global mental health, wellbeing, and the human experience in general?
Wir leiden als Gesellschaft ohnehin schon enorm unter den immer größer werdenden Auswirkungen eines Mangels an Empathie, meines Erachtens nach resultierend aus dem Fehlen einer Vorstellung, eines Vokabulars, eines inneren Abbildes oder wenigstens einer Möglichkeit, die von Anderen kommunizierten Emotionen zu verarbeiten. Zueinander, gegenüber, ja selbst auf einer partnerschaftlichen, intimen Ebene scheitert diese Kommunikation. Die Gefahr einer KI liegt nun darin, die letzten Reste des Bemühens um eine solche Fähigkeit als obsolet erscheinen zu lassen.
In flattening the diversity of facial expressions of civilizations around the world AI had collapsed the spectrum of history, culture, photography, and emotion concepts into a singular, monolithic perspective. It presented a false visual narrative about the universality of something that in the real world — where real humans have lived and created culture, expression, and meaning for hundreds of thousands of years — is anything but uniform.
Heute schon fehlt uns das sprachliche Rüstzeug, um komplexe Situationen adäquat zu beschreiben. Das Gestammel, das wir uns tagtäglich anhören müssen und von dem wir wissen, dass es nicht ausdrückt, was es sagt, ist ein Beispiel für den Verlust des für den Bau von Positionen notwendigen Wortmaterials. Englische Hilfsausdrücke („Meeting“, „Call“) für in der deutschen Sprache mit einer ganz anderen Konnotation belegten, faktisch aber selben Tätigkeiten („Treffen“, „Besprechung“), täuschen über unseren Alltag hinweg und gaukeln uns vor, etwas zu sein, was abzubilden, was es, also dieses Etwas, aber nicht ist. Oder sind wir es, die diese Begriffe unter der Ironie des Alltags leidend bewusst einsetzen?