OpenAIs Ghibli-Slop, eine vulgäre Machtdemonstration

OpenAIs Ghibli-Filter greift die Kunst an einer Stelle an, die sie nicht nur im besonderen Fall des japanischen Zeichentrickfilmstudios, sondern auch ganz allgemein, im Verständnis darüber, was Kunst nämlich ist, kann und soll, angreift. Und dieses Gimmick ist ja auch nur eines von vielen.

Seit OpenAI vor ein paar Tagen die verbesserten Funktionen zur Bildgenerierung vorgestellt hat, werde ich, vor allem in den sozialen Medien, von mir bekannten Bildern überflutet, die neu, nämlich im Stil des japanischen Zeichentrickfilmstudios Ghibli, generiert wurden. OpenAI hat also ein neue Waffe in sein Arsenal aufgenommen, die den Stil des einen auf ein anderes Bild übertragen kann.

Von Anfang an fühlte sich die Möglichkeit der Übertragung eines Stils vom einen Bild aufs andere für mich auf der einen Seite faszinierend, auf der anderen Seite aber aus einem noch unerfindlichen Grund nicht richtig an. (Das tat es, ich will das hier gleich ergänzen, aber auch schon in der Anfangszeit von OpenAI bzw. ChatGPT, als die Funktion, „im Stil von Ernest Hemingway“ zu schreiben, recht populär war und häufig gnutzt wurde.) Den Stil des einen Bildes – oder, ich bleibe abstrakt – des einen Kunstwerks auf ein anderes übertragen? Das mag zwar ein witziger und im Falle von Fotos und Bildern deutlich sichtbarer Effekt sein, der die Möglichkeiten einer Technologie sehr gut veranschaulicht, gleichzeitig aber bedingt die Anwendung dieses Effekts auf der einen Seite die Entwertung und Dekontextualisierung der Kunst vom Künstler oder der Künstlerin, auf der anderen Seite wird ihre Bedeutung und Aussage, vor allem aber ihre Wirkung, auf ein billiges Minimum reduziert. Und was diejenigen angeht, die sie zur Anwendung bringen: Sie bleiben träge und festgefahren in ihrer künstlerischen und – ich möchte behaupten – intellektuellen Entwicklung. Da sie sich nicht mit der Reflexionsarbeit auseinandersetzen, die Kunst und jede andere Form der Kreativität mit sich bringt, versäumen sie einen wesentlichen Bestandteil ihres Lebens, auch wenn sie sich einreden, Zeit zu gewinnen.

Kunst ist das Bedürfnis, eine Situation zu verarbeiten, und die gleichzeitige Erwartung, den inneren Konflikt hierüber abschließen zu können

Was des Künstlers innerstes Bedürfnis ist, um mit einer bestimmten Situation umgehen zu können, woran er gearbeitet hat, bis das Ergebnis die Aussagekraft hatte, die es benötigte, ihre Verarbeitung abschließen zu können, was der Künstlerin notwendiges Ergebnis war, das dazu führte, das Werk Wort für Wort, Pinselstrich für Pinselstrich, Iteration um Iteration zu verbessern, bis endlich erreicht war, was von Anfang an mit der Erwartung geschaffen wurde, innere Ruhe zu erlangen und den Konflikt hierüber abschließen zu können, weil verarbeitet wurde, was verarbeitet werden musste, wird hier auf einen banalen Fotofilter – was anderes ist denn die Übernahme eines Stils auf ein anderes Bild denn sonst? – reduziert. Der Widerspruch, und vermutlich auch das Unwohlsein und die innere Ablehnung der retuschierten, im Ghibli-Stil präsentierten Bilder, generiert aus banalen Alltagsfotografien, halbwitzigen Memes oder dem Foto einer Drogendealerin liegt auf der Hand: Der Stil ist weder persönliches Bedürfnis einer Person, noch ein notwendiger Verarbeitungsprozess. So ein generiertes Bild ist AI-Slop, nicht mehr und nicht weniger, billig Nachgeahmtes statt eigenständig Geschaffenes.

the „ghibli-style“ AI image filter is not producing „ghibli-style“ images because ghibli’s „style“ is not determined solely by its visual appearance. Studio ghibli would not produce a fascist image, for example. its drawings are made by a team, in a communal studio space, in conversation with each other. […] ghibli’s ethics are a primary constituent of its house style, perhaps more than its drawing style (which varies, obviously, ghibli is not all miyazaki).

alex

Die Sache ist aber nicht nur ein Problem des Werkes, sondern zu gleichen Teilen eine Irreführung und Fehlleitung des Betrachters. Ihm oder ihr wird der wesentlichste, herausforderndste und interessanteste Teil des Betrachtens von kreativer Arbeit vorenthalten. Die Möglichkeit, nämlich, das Werk zu analysieren oder, was noch viel schöner ist, einer Interpretation zu unterziehen. Aus einer den Intellekt ansprechenden und den Geist über die Reflexion des eigenen Daseins herausfordernden Tätigkeit wird bestenfalls ein mentales Like.

Warum? Weil zwischen Motiv, Herleitung und Stil Dissonanz entsteht, die, wenn sie nicht bewusst von einer künstlerisch tätigen Person verursacht wurde (und damit schon wieder herbeigeführt und den oben skizzierten Kriterien entsprechen würde), unpassend erscheint, keinen Sinn macht und somit wertlos wird.

Langeweile ist Stil ohne Kontext und ohne Kenntnis der Hintergründe

Wenn wir eine Person weinen sehen, dann gehen wir davon aus, dass etwas nicht stimmt, wenn wir sie lachen sehen, dann können wir davon ausgehen, dass sie gut drauf ist, wenn wir sie wütend, verliebt, traurig, nachdenklich oder in sonst irgendeiner erkennbaren Stimmung wahrnehmen, ist das bereits ein Teil der Kommunikation und wir legen unsere eigenen Erfahrungen ins Verständnis der Nachricht mit hinein, gehen dabei von einer bestimmten Situation aus, die den Kontext für alles, was wir an Interaktion mit dieser weinenden, lachenden, traurigen oder verliebten Person vornehmen, bestimmt. Wir können im besten Fall nachvollziehen, wie es der Person geht, noch bevor wir das erste Wort mit ihr sprechen. Ihr Erscheinungsbild vermittelt uns den Kontext, in dem wir ihre Aussagen wahrnehmen werden. Nicht anders verhält es sich mit dem Ghibli-Filter oder, ganz allgemein, mit jedem prägnanten, auffälligen oder einprägsamen Stil. Wenn ChatGPT oder das 4o-Modell, wie auch immer man die Technologie nun bezeichnen will, ist eigentlich auch egal, Texte, Bilder oder Videos in einem bestimmten Stil generiert, dann ist das nicht anders, solange wir die Erwartungshaltung kennen und nachvollziehen können.

Der Stil selbst transportiert eine Erwartungshaltung, eine Geschichte, eine Stimmung, weckt Erinnerungen und Bilder. Er ist von seiner Genese und dem Künstler oder der Künstlerin nicht zu trennen. Was bringt es also, vor allem aber welche Aussage verbirgt sich hinter einem Bild, das im Stil von aber ohne die Seele und die Geschichte von Pablo Picasso, Claude Monet, Vincent van Gogh, Gustav Klimt, Wassily Kandinsky, Caspar David Friedrich, Pierre-Auguste Renoir, Leonardo Da Vinci, Egon Schiele, Albrecht Dürer, Paul Cézanne, Edvard Munch, Paul Gauguin, Amedeo Modigliani, Sandro Botticelli, Katsushika Hokusai, Piet Mondrian, Hieronymus Bosch, Edouard Manet, Joaquin Sorolla oder Salvador Dali1 generiert wird? Bei jedem einzelnen dieser Namen haben wir Bilder im Kopf und unsere Wahrnehmung blitzt mit Geschichten, Erinnerungen, Emotionen und Reaktionen auf, ohne, dass wir überhaupt noch konkret gesehen haben, was uns präsentiert wird. Die Abstraktion des Stils allein hat schon etwas in uns ausgelöst. Und dann ein finales Werk zu sehen, überflutet uns mit Eindrücken, die durch Kenntnis des Kontexts umso interessanter erscheinen.

Dieser Effekt ist Wirkmacht, kulturelles Erbe, das Lebenswerk eines Künstlers oder einer Künstlerin; und er verdient Respekt. Aber auf den pfeift OpenAI und gibt Hinz und Kunz ein Werkzeug in die Hand, mit dem ein Einfaltspinsel seine verschwommenen Familienfotos nun also „mit dem Stil“ (ich sage bewusst nicht: „im Stil“) großer Künstlerinnen und Künstler schmücken kann.

Stile mittels Künstlicher Intelligenz kopieren, ist anspruchslose Imitation

Das japanische Zeichentrickfilmstudio Ghibli hat einen ganz eigenen Stil in Erzählung, visueller Darstellung, charakterlicher Entwicklung seiner Figuren und Stimmung in den Szenen entwickelt und sie über mehr als vierzig Jahre hindurch mehr und mehr ausgearbeitet, bis alle für die im Studio arbeitenden Menschen wesentlichen Aspekte der dort produzierten Kunst den Grad an Perfektion erreicht haben, der ausmacht, was man heute unter „Ghibli“ versteht. Ich denke, man kann die Arbeiten des Studios in Bezug auf ihre markante Art relativ problemlos in die Reihe der oben genannten Künstler (und zwar oben nicht genannter, sicherlich aber existierender Künstlerinnen) einreihen. Der visuelle Stil, die Art, mit Situationen umzugehen, sie in der Kunstform selbst zu verarbeiten, ist einzigartig. Auch wenn es „nur“ ein Studio für Zeichentrickfilme ist. Ghibli ist Kunst, nicht der generierte Müll, den uns zum Beispiel ein Konzern wie Disney verkaufen will.

Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen
Trailer von Ghiblis „Spirited Away“

Kann man aber, und das ist ja die Frage, um die es geht, den Stil des Studios nutzen, um ihn auf Bildmaterial alltäglicher Situationen anzuwenden? Sicherlich kann man, wenn dadurch die Bedingung erfüllt ist, etwas zu produzieren, das aus dem Grund heraus entsteht, ein Bedürfnis zu sein, eine bestimmte Situation verarbeiten zu müssen, und die gleichzeitige Erwartung, den inneren Konflikt des Künstlers oder der Künstlerin hierüber abschließen zu können. Trifft das auf die allermeisten im Ghibli-Stil geschmückten Bilder, die in den letzten Tagen auf unser herniederprasseln, zu? Mitnichten. Sie sind ein „Ich auch“ derer, die heute noch (in meinen Augen irrtümlich) glauben, mit Künstlicher Intelligenz generierte Werke hätten einen Wert. Es gibt, das nur nebenbei, nicht umsonst eine hitzige Diskussion darüber, ob man mittels KI generierte „Kunst“ schützen lassen kann.

Es ist aber nicht nur Ghibli, wenngleich dieses Beispiel schon sehr prominent ist, auch andere Studios, Künstlerinnen und Künstler, die sich meist aus finanziellen Gründen nicht wehren können, mussten bereits herhalten. Der vorhin schon erwähnte Ernest Hemingway, der benutzt wurde (und, wie ich leider selbst von Kollegen weiß: wird), um Proposals und andere Gebrauchstexte zu verfassen, zum Beispiel. Auch hier ist die ganze Sache nur ein billiges Kaschieren der eigenen Unfähigkeit, einen halbwegs brauchbaren Text zu verfassen. Künstliche Intelligenz kann hier wie eine Prothese funktionieren und das mangelnde Vermögen ein wenig ausgleichen. Das Ergebnis ist aber ein durchschnittlicher Normwert, kein herausragendes Kunstwerk. Was die KI aber nur in sehr geringen Zügen wird ausgleichen können, wenn das überhaupt ein Thema ist, ist des Autors oder der Autorin Verständnis oder die Analyse von und die Kompetenz im Umgang mit Worten innerhalb eines Texts. Sich zwanzig Sekunden lang ein Video anzusehen ist in vielen Fällen schon zu viel verlangt; einen längeren Text lesen, aufnehmen, verarbeiten und darauf womöglich noch passend, im allerbesten Fall sogar für Leserinnen und Leser herausfordernd zu reagieren, ist eine ganz andere Dimension intellektuellen Aufwands, die – da müssen wir uns ehrlich sein – zur Seltenheit geworden ist. Herausforderung verkauft sich nicht gut, AI-Slop offenbar schon. Wahrscheinlich ist das der Grund, warum alles, was es an moderner Unterhaltung gibt, immer langweiliger, vorhersehbarer und somit uninteressanter wird. Und wahrscheinlich ist das auch der Grund, warum der Aufschrei über die KI-generierte und grottenschlechte Version der Coca Cola-Weihnachtswerbung, bis auf in wenigen Kreisen anspruchsvollerer Menschen, ausgeblieben ist.

Nun aber Ghibli

Nun aber die Bilder im Stil des Zeichentrickstudios Ghibli. Kopierter, aber entkontextualisierter Stil, in Wirkmacht und Genese entwertete Bemächtigung des Lebenswerkes der Gründer des Studios, darunter der in letzter Zeit öfter zitierte Hayao Miyazaki. „Es schaut lieb aus“ ist das einzige, was von seiner und der Kunst des Studios übrig bleibt. Ein Lebenswerk, mehr als vierzig Jahre Arbeit, wird zum „Filter“ in einem KI-Chatprogramm. Der kreative Prozess, dem sich das Studio gestellt hat, um ein Ergebnis zu produzieren, das seinesgleichen sucht, nachträglich vernichtet. Wir freuen uns über die hübsch aussehenden Bildchen, sie machen uns auf eine unbefriedigende Art und Weise glücklich. Die Bilder sind komplett ihres Wertes beraubt, sie werden ohne Inhalt präsentiert und dienen bestenfalls dem gleichen Zweck wie die in Möbelgeschäften häufig genutzten Buchattrappen und Scheinstapel: Entleerte Hüllen, die einen Schein produzieren sollen, der das tatsächliche Sein, unsere Leere, unsere eigene Unfähigkeit, also die Abwesenheit von Besonderem in unserer Arbeit zu verdecken.

Aber was schert das Durchschnittsgemüt all der als Ballast wahrgenommene Unterbau, den ich seit mehreren Absätzen in diesem Artikel immer und immer wieder erwähne? Was schert den Meme-Versender, den Social Media-Poster die raison d’être für das, was uns nun als Ghibli-Stil und als etwas Besonderes verkauft wird? Was lockt mehr als die Verfügbarkeit von Besonderem? Wie kann ich als einzelnes Individuum in einer für uns Menschen ohnehin nicht mehr verarbeitbaren Menge an potentiellem Publikum hervorstechen? Wie kann ich mich bemerkbar machen? Schon stürzen sich hunderttausende Userinnen und User auf die Stil-Kopiermaschine, um besonders zu sein. Um zu den ersten zu gehören, die solche Bilder hochgeladen haben. Um die Wahrscheinlichkeit zu erhöhen, als Name hinter dem Satz „zuerst gesehen bei“ zu stehen? Sie laden ihre Fotos hoch und die im Ghibli-Stil generierten wieder herunter, bevor sie sie in den sozialen Medien veröffentlichen. Sie, diese User also, werden besonders, in dem sie sich mit fremden Federn schmücken. Die Natur kennt das Prinzip der Mimikri seit Jahrmillionen. Und weil es aber so viele sind, so dermaßen viele, übersehen die dieses Prinzip anwendenden Menschen, dass die Einzigartigkeit, ja die Besonderheit dieses Stils, mit der Tatsache, dass eine Künstliche Intelligenz sie auf jeden Dreck, den man hochlädt, anwenden kann, verloren gegangen ist. Sie schmücken sich also mit etwas, das einen Wert zu haben scheint; aber allein aus der Tatsache heraus, dass es in einem Computerprogramm verfügbar ist, de facto wertlos geworden ist.

Im Fall von Studio Ghibli ist das in doppelter Hinsicht herzzerreißend. Das Studio steht wie kaum ein anderes für traditionelle Animationskunst. Obwohl das Unternehmen seit einigen Jahren digitale Technologien einsetzt, ist der heute 84-jährige Hayao Miyazaki ein Verfechter des Handwerks. […] Ein knappes Jahrzehnt später lässt sich die Kunst, der sich Miyazaki und seine Mitstreiterinnen und Mitstreiter ein Leben lang gewidmet haben, in wenigen Sekunden durch die bloße Eingabe eines entsprechenden Prompts mit einem Computer kopieren.

Zeit Online

Ich wiederhole mich, kann aber nur noch einmal darauf hinweisen: Was die wenigsten verstehen, die dieses KI-Tool mit dem Ghibli-Stil nutzen, ist, dass der Zeichenstil nur das Ende eines Prozesses darstellt. Es ist die Medaille, die man nach dem Marathon erhält, der Badge, der auf die Leistung folgt, die Gratulation, die einem für ein gelungenes Projekt ausgesprochen wird. Kauft man die Medaille im Großhandel, den Badge im nächsten Geschäft oder gratuliert man sich selbst, dann sind diese Symbole des Ende eines Prozesses wertlos. Genauso verhält es sich mit dem über Jahrzehnte entwickelten Stil einer Künstlerin, eines Künslters oder eines ganzen Studios. Wer also Bilder im Ghibli-Stil nachahmen lässt, kauft sich eine Medaille und gratuliert sich gleichzeitig selbst.

Kein Prozess, keine Evolution, keine Genese, keine Kunst

Jürgen Greuter (aka. tante), der, was OpenAI mit dem Zurverfügungstellen des Filters getan hat, eine „vulgäre Machtdemonstration“ nennt und der Meinung ist, OpenAI habe das Studio Ghibli ganz bewusst ausgewählt, weil Hayao Miyazaki, Mitgründer des Studios, Künstliche Intelligenz als seiner Kunst fremd ansieht und so wenig wie möglich damit zu tun haben möchte (dazu gleich), betont diesen Punkt in seinem lesenswerten Artikel.

Während wir einfache Zuseher uns an der Art und am Stil eines Bildes erfreuen und die Wirkmacht der Kunst spüren, ohne die tieferliegenden Zusammenhänge zu verstehen, blickt der Künstler oder die Künstlerin auf die Genese dieses Stils, auf seine Evolution, auf die Beweggründe, die das alles verursacht haben, was letztendlich zum Werk wird; und auf die motivierenden Aspekte, einen individuellen Stil in eine bestimmte Richtung zu treiben. Das Werk ist Resultat und Prozess zu gleichen Teilen. Entfernt man einen Teil, bricht es in sich zusammen. Oder meint tatsächlich jemand, OpenAI würde es scheren, welche Bilder, in welchem Zusammenhang, mit welcher Aussage mit dem Ghibli-Filter ausgestattet würden?

At the core of Studio Ghibli’s work is a deep engagement with questions of humanity. About what it means to be a human, about how to care for one another and the world around us. But also about the levels of cruelty that humanity can be capable of – and how there still are grace and love even under those conditions. Studio Ghibli’s work is distinct. In the level of quality over the years, in their very recognisable art style.

tante

Kunst ist das nach außen gekehrte Innere der Verarbeitung einer Situation, der sich ein Künstler oder eine Künstlerin aussetzt. Die Kunst der Entwicklung zu berauben, sie als punktuelles und entkontextualisiertes Einmalbild zu verstehen, sie nicht zu erleben und zu fühlen, ist in meinen Augen ein Mangel an Verständnis darüber, was Kunst eigentlich ist. Wir tun sie ab, die Kunst, und setzen sie so in einen isolierten, Anderen überlassenen Bereich des Lebens. Kunst kann ja so dermaßen anstrengend und mühsam sein. Sie erfordert so viel Reflexion über das eigene Leben, unsere Schicksale und über die Wege, die uns bis zu dem Moment geführt haben, dem wir nun ausgesetzt sind, wenn wir uns mit Kunst konfrontieren. Kunst besteht somit nicht mehr nur aus dem Problem und der Problemlösung eines Künstlers oder einer Künstlerin, sondern nimmt auch noch diejenigen, die Kunst betrachten, empfinden und genießen mit in seine Rechnung. Ja wer hätte das gedacht? Kunst ist mehr als nur ein Comic-Filter.

Unter diesem Aspekt ist verständlich, warum Miyazaki der Anwendung von Künstlicher Intelligenz so dermaßen stark entgegentritt; sie beraubt die Kunst nämlich ihres eigentlichen, zutiefst menschlichen Sinns: der Reflexion aufseiten des Künstlers und der aufseiten des Betrachters. Passiert das einmal und enthebt eine Technologie Kunst ihrer Wirkung, dann verlieren wir Menschen einen Teil unserer Menschlichkeit, da wir uns selbst der anspruchsvollsten Ausdrucksform überhaupt berauben und sie an ein Computerprogramme auslagern.

I am utterly disgusted. If you really want to make creepy stuff, you can go ahead and do it, but I would never wish to incorporate this technology into my work at all. I strongly feel that this is an insult to life itself. […] I feel like we are nearing the end of times. We humans are losing faith in ourselves. […] “Whoever creates this stuff has no idea what pain is.” Or joy. Or love. Or hunger. Or longing. Or need. Or want. All the parts of us that define our humanity and our way of interacting with the world. The things that make us care, that push us towards doing something, finding something out. Saying something and hearing something.

Hayao Miyazaki, zitiert und ergänzt bei tante

Wer das so oder so ähnlich sieht, und eben nicht dem Licht folgen möchte, das von zweifelhafter Hand vor uns hergetragen wird, möge doch bitte aufhören, der Kunst und ihren Künstlerinnen und Künstlern respekt- und verständnislos entgegenzutreten. Denn was hier passiert, ist eine doch recht simple Bemächtigung der Leistung Dritter, um sich selbst in eine Position zu bringen, die, hält man nur lange genug durch und überlebt man potentielle Gerichtsprozesse, das eigene Produkt unabdingbar macht.

KI-Unternehmen schmücken sich mit fremden Federn, um denjenigen, die es nicht selbst auf die Reihe kriegen, aber trotzdem ubedingt wollen, fremde Federn verleihen zu können. Da es derer viele gibt, ist auch die Gewalt, mit der KI-Unternehmen auf Trainingsdaten zugreifen wollen, stark gestützt. Mich wird es ja nicht betreffen, geht da wohl in den Köpfen derer vor, die ihre Kritzeleien verschönern lassen. Aber dass das Vorgehen der Unternehmen die Kreativität zerstört und diejenigen, die tatsächlich Kunst produzieren, vernichtet, ist bestenfalls einen Nebensatz wert. Ingrid Brodnig hat diesen Punkt in ihrem letzten Newsletter ein wenig beleuchtet und erwähnt dabei auch, wie sich der Anspruch, über den ich in diesem Artikel schon zur Genüge geschrieben habe, senken wird, was einen Teufelskreislauf für Kunst, Künstlerinnen und Künstler, ihre Einkünfte und uns als Gesellschaft, die wir die Notwendigkeit von Kunst nicht mehr erkennen und verstehen werden, bedeutet.

KI-Unternehmen eignen sich das kreative Schaffen anderer Menschen an – ohne zu fragen – und steigern damit ihren eigenen Wert. […] Derzeit werfen Gerichtsverfahren ein Licht darauf, wie sich KI-Unternehmen ungebremst der kreativenArbeit anderer Menschen bedienen, um ihre KI zu trainieren. […] Die Tragische aus Sicht von Kreativen ist: Bei vielen KI-Anwendungen geht es nicht darum, dass die KI das perfekte Ergebnis liefert, sondern oft reicht für User:innen bereits, ein Ergebnis, das “gut genug” ist. Also zum Beispiel, wenn man selbst nicht zeichnen kann, wird die KI in vielen Fällen beeindruckendere Bilder kreieren als man das selbst als unkreative Person könnte […]. Nur zeigt derzeit gerade der Vergleich von diesen ChatGPT-Bildern mit tatsächlichen Szenen aus Studio-Ghibli-Filmen, wie viel mehr Tiefgang und Klugkeit ein guter Animator oder eine gute Animatorin in solche Szenen einfließen lassen kann.

Ingrid Brodnig

Diese KI-Maschinen hinterlassen sehr viele offene Wunden in Bereichen, die sie eigentlich stützen sollten. tante hat schon recht, wenn er das, was OpenAI da abliefert und macht, eine „vulgäre Machtdemonstration“ nennt..

OpenAI will Teil des Internets werden. Nicht „auch mit“, sondern „durch“ die Bemächtigung der Leistung Dritter

Dein Bild im Ghibli-Stil verstärkt den Einfluss eines Konzerns wie OpenAI, Teil des Internets selbst zu werden. Wenn tante und andere (auch dazu gleich) das, was OpenAI da präsentiert hat, als ganz bewusste Aktion sehen, dann ist da etwas dran. Man mag das vielleicht umgeben von der Romantik und der heilen Welt des Ghibli-Stiles vergessen, aber OpenAI hat Probleme. Viele davon.

This isn’t another laugh, another coy attempt at circumventing someone’s rights to their creations; the way this has been pitched and sold is a direct attack, a flex revelling in the fact creators have so far proven largely powerless to stop these vultures from looting the history of human creation wholesale. […] So yeah, it sucks! Which is why people need to stop sharing that shit. […] The power of AI imagery isn’t in its capabilities, it’s in its attempts to become ubiquitous. It’s (likely) illegal and immoral to be making this stuff […] Companies like OpenAI are hoping that […] their tech can […] become […] part of the background noise of the modern internet, and the more likely it is that they themselves will become part of the fabric of the modern internet, and not a bunch of raiders stripping the place for its creative wiring.

aftermath

OpenAI vernichtet Geld in unvorstellbaren Mengen. Es muss also eine Strategie entwickeln, sich unabdingbar zu machen. Ähnlich, wie es zum Beispiel auch dem Bildbearbeitungsprogramm Canva gelungen ist, das de facto Tool für Instagram zu werden und sich so in die Liste der notwendigen Werkzeuge für die auf Instagram aktiven Menschen zu zementieren. Unter diesem Gesichtspunkt ist ein Ablenkungsmanöver wie „Ghibli“ reines Marketing. Man spricht endlich wieder über OpenAI. Und wieso will OpenAI ein unabdingbarer Teil des Internets selbst werden? Nun ja, weil es an allen Ecken und Enden brennt.

Here’s the short version of why OpenAI is in trouble:

  1. All LLMs trained on the same data will give about the same results. So, the Common Crawl plus whatever else they can scrape up, like every book on LibGen. That’s because LLMs are lossy compressors for text. Similar input means similar output. This is a well-known result.
  2. Facebook’s Llama model is freely available after the model weights leaked. And you can run it at home on your gaming PC.
  3. If you want a new LLM, start with Llama and retrain the weights much more cheaply, and you can get something that does about what OpenAI’s GPT series does. You can even tune it to this week’s hot benchmark!
  4. Your name is DeepSeek, you did a quick Llama retrain, and, with this one weird trick, you just crashed the NASDAQ.

DeepSeek paid the slightest attention to efficiency and showed that you could train a model that was about as good as OpenAI for way less. Then you don’t have OpenAI-level expenses to pay off — so you can sell API access for much less. That cheap API got a lot of OpenAI customers moving to DeepSeek.

Pivot to AI

Da sind wir nun. Was sich da gerade vor unseren Augen abspielt ist bemitleidenswert, weil es uns nicht betrifft, katastrophal, allerdings, sobald es uns betrifft. Wir alle wissen, dass Miyazaki, auch wenn man seine Meinung als extrem abtun will, in gewisser Weise doch recht hat.

Ghibli-Slop ist nicht Ghibli. Und auch eine Künstliche Intelligenz macht dich nicht zur Künstlerin oder zum Künstler

Ich bin auf dem Netzwerk, das einmal Twitter2 war, auf eine Aussage von Daniel Koller zum Thema OpenAI und Studio Ghibli gestoßen.

Muss gestehen, dass ich die Studio Ghibli Bilder hier auch ziemlich feiere, aber wenn man so darüber nachdenkt, ist es eigentlich eine Sauerei von OpenAI. Im Grunde wird ein künstlerisches Lebenswerk zur spielerischen Massenware gemacht und aufs Copyright komplett geschissen.

Daniel Koller

So weit, so verständlich und nachvollziehbar. Interessant wird die Sache für mich aber durch eine Antwort von Patrick Swanson, der früher Social Media-Chef der österreichischen Nachrichtensendung „Zeit im Bild“ war und jetzt – natürlich – ein Beratungsunternehmen für den Bereich Künstliche Intelligenz betreibt, mit einem etwas lauwarmem, wenngleich aber viel Hintergrund offenbarendem Argument, dessen sich eigentlich nur diejenigen bedienen können, die die Arbeit Dritter kostenfrei für sich nutzen wollen.

hab über das heute auch nachgedacht. ich glaub aber, dass die ethik-frage da nicht so klar ist – wie viele millionen menschen haben erst in den letzten 24 stunden von ghibli erfahren und gehen jetzt die originale anschauen? und: 24 stunden freude in der welt sind auch was wert.

Patrick Swanson

Ich bezweifle stark, dass ein Stil, den die meisten ohnehin nicht verstehen, irgendjemanden dazu motivieren wird, das Original zu betrachten, aber sei’s drum. Spannend ist aber die Argumentation allemal, weil sie ja beinhaltet, dass es „ethisch“ doch irgendwie okay sein muss, das Copyright de facto zu ignorieren, um eine Technologie überhaupt erst konkurrenzfähig machen zu können. Hat nicht Sam Altman das sogar auf eine politische Ebene heben und das das Copyright ignorierende Training von Künstlichen Intelligenzen als Fair-Use deklarieren lassen wollen? Na klar war da was! Die „Magie“ der KI ist halt auch nur, was das Marketing daraus macht. Und das Copyright übergehen, ich habe es oben im Ausschnitt aus Ingrid Brodnigs Newsletter auch schon aufgeworfen, ist wohl the way to go.

Currently, courts are mulling whether AI training is fair use, as rights holders say that AI models trained on creative works threaten to replace them in markets and water down humanity’s creative output overall. […] OpenAI is […] fighting with rights holders in several dozen lawsuits, arguing that AI transforms copyrighted works it trains on and alleging that AI outputs aren’t substitutes for original works. […] One landmark ruling favored rights holders, with a judge declaring AI training is not fair use, as AI outputs clearly threatened to replace Thomson-Reuters‘ legal research firm Westlaw in the market, Wired reported. But OpenAI now appears to be looking to Trump to avoid a similar outcome in its lawsuits, including a major suit brought by The New York Times.

Ars Technica

Und hier kommt sie, die Argumentation, mit der OpenAI versucht, sich des Copyrights Dritter zu entledigen, in dem es dieses Copyright umdeutet. (Was übrigens, nur so nebenbei, zu Blüten führt, wenn es OpenAI selbst betrifft.) Copyright gilt eh, heißt es da, nicht aber, wenn wir unsere Modelle darauf trainieren. Weil wenn wir das nicht tun, so die Warnung, gewinnen die Chinesen. Und deshalb, so die Empfehlung, sollten wir bitte das Copyright ignorieren können, wenn es um die Arbeit Anderer geht. Einige sind halt eben gleicher als andere.

„OpenAI’s models are trained to not replicate works for consumption by the public. Instead, they learn from the works and extract patterns, linguistic structures, and contextual insights,“ OpenAI claimed. „This means our AI model training aligns with the core objectives of copyright and the fair use doctrine, using existing works to create something wholly new and different without eroding the commercial value of those existing works.“ […] In their policy recommendations, OpenAI made it clear that it thinks funneling as much data as possible to AI companies—regardless of rights holders‘ concerns—is the only path to global AI leadership. „If the PRC’s developers have unfettered access to data and American companies are left without fair use access, the race for AI is effectively over,“ OpenAI claimed.

Ars Technica

Aber gut, das ist in Wirklichkeit schon Material für einen weiteren Artikel. Bleiben wir bei Ghibli.

Das Unwohlsein bleibt, egal warum. Wer den Artikel bis hierher gelesen hat, wird auch den Schluss, die Frage, die von einer Userin auf Mastodon aufgeworden wird, nun nachvollziehen können.

Miyazaki is an artist, and frankly that man is melodramatic. It’s goes with his particular brand of superlative talent & genius. So, while I agreed with his objections to AI, and enjoyed seeing the AI boys getting a thrashing, I assumed his comments about „insult to life“ and „dead zombies“ were hyperbolic. It couldn’t possibly be that bad, right? Then I saw some of the animations in the „Ghibli Style“ from AI. They are an insult to life itself. Soulless, dead, animated corpses. […] It makes it even more funny that some people are using „Ghibli Style“ AI images as their profiles. It’s less noticeable in still images, but having seen what this stuff looks like when it’s moving it’s like they have a dead body as their profile pic. And for some reason they can’t see it. […] Why can’t they see it?

myrmepropagandist

Warum, also? Warum können die Menschen nicht sehen, was da passiert? Warum sehen sie nicht, dass sie einen sprichwörtlichen Leichnam als Profilbild nutzen? Was macht es so attraktiv, sich auf Kosten des selbst mit fremden Federn zu schmücken? Sind wir wirklich alle nur eine große Gruppe von Möchtegerns?

  1. Ja, ja, ich weiß: nur Männer. ↩︎
  2. Merkt ihr es auch hier? „Twitter“ ist ein Begriff, der das Netzwerk in seiner Idealform bezeichnet. „X“ ist ein mit Elon Musk assoziierter, weitaus negativer Begriff, der das Netzwerk in einem völlig anderen Licht erscheinen lässt. – Words matter, und Stile eben auch, denn sie transportieren weit mehr als nur das visuelle Erscheinungsbild. ↩︎

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Benachrichtige mich bei Reaktionen auf meinen Kommentar. Auch möglich: Abo ohne Kommentar.