Qualitätsproblem der Zulieferkanäle Google und Social Media

404 Media schreibt einen anfänglich nach Rechtfertigung klingenden Beitrag und liefert dabei ganz nebenbei eine hervorragende Analyse über Googles KI-Problem im Online-Markt für originäre Inhalte produzierende Medien ab.

Das Team von 404 Media hat vor zwei Tagen einen Artikel in eigener Sache veröffentlicht, in dem es sich rechtfertigt, warum es nach den E-Mailadressen seiner User:innen fragt und ganz nebenbei eine ausgezeichnete Bestandsaufnahme über Journalismus und seine Medien, die Zulieferkanäle Google und Social Media, sowie die vollkommen falsch eingeschätzten Gefahren der Anwendung von Künstlicher Intelligenz abliefert.

Was zuerst klingt, wie eine plumpe Bewerbung des hauseigenen Newsletters, entpuppt sich bereits nach wenigen Zeilen als Analyse des Onlinemarkts für Lesemedien und die nicht nur unterschätzte, sondern gänzlich unverstandene Gefahr von Künstlicher Intelligenz, die wir alle so gerne und unreflektiert nutzen. Ebenso wird während der Lektüre des Artikels das immer größer werdende Qualitätsproblem bei Google klar, das so viele Online-Geschäftsmodelle mit in den Abgrund reißt, weil es der Suchmaschine ganz offensichtlich egal ist, ob ein Inhalt von einer KI generiert oder von Menschen recherchiert, auf Qualität geprüft und letztlich auch geschrieben wurde. Das mag auf den ersten Blick tatsächlich egal sein, schließlich ist es Googles Job einen Inhalt mit einer URL zu verknüpfen, nicht mehr oder weniger, aber irgendwann ist dieser Inhalt kein „Inhalt“ mehr, sondern „Spam“. Und den will nun wirklich niemand als Suchergebnis präsentiert bekommen.

Aber auch die sozialen Medien bekommen als versagender Zulieferkanal ihren Senf ab. Elon Musk auch ein bisschen. Aber nur in einem Nebensatz.

We are realizing that in order to combat the fracturing of social media platforms, a Google discoverability crisis fueled by AI generated spam and AI-fueled SEO, and a media business environment that is in utter freefall, we need to be able to reach our readers directly using a platform that we own and control. To do that, we need your email address. […] We noticed that articles we spent significant amounts of time on […] were being scraped by bots, run through an AI article “spinner” or paraphraser, and republished on random websites. […] Requiring an email address to read our articles has, for the moment, stopped our content from being scraped and repurposed by AI. It will also, we hope, serve as a preventative measure against the impacts of the internet being flooded by all of this AI-generated drek. We are worried that a flood of low-quality, AI-generated bullshit—articles written by robots to appease a robotic search ranking algorithm—is going to drown out what we do, and make it harder to organically find our work.

404 Media

Wer auch immer Texte produziert und sie online zur Verfügung stellt, sei es aus Spaß, wie ich hier, oder aus Berufung, wie alle Journalistinnen und Journalisten, die ehrlich bemüht sind, qualitativ hochwertige Inhalte zur Verfügung zu stellen, sollte sich die sehr unangenehme, aber treffende Analyse von 404 Media zur Gänze durchlesen. Der Artikel ist richtig, richtig gut, geht in einer Liste voller Beispiele, die zeigt, wie aus gutem Content KI-generierter Müll wird, auf viele, eindeutig nachweisbare Fälle von Content-Diebstahl ein und zeigt auf, wie mit ein paar Tools tausende Beiträge automatisiert generiert werden können (in dem aufwändig recherchierte Originale einfach umgeschrieben und auf der eigenen Website publiziert werden). Kurzum: Wer sich die „Rechtfertigung“ fürs Hinterlegen der eigenen E-Mailadresse bei 404 Media durchliest, erkennt, dass das Internet durch AI zu einem Raum geworden ist, den man nicht mehr betreten möchte ohne sich ständig die Hände zu waschen. Eine Art Zutrittssperre durch Hinterlegen der eigenen Mailadresse soll das vorläufig unterbinden.

Was aber nun mit Google und den sozialen Medien? Auch da ist die Analyse – hier auch wieder sehr stark verkürzt – mehr als treffend. Regelmäßige Leserinnen und Leser meines Blogs werden viele der Argumente und Punkte, die 404 Media aufzählt, bereits kennen. Zum Thema Google:

Each of us have […] sat in meetings with SEO consultants who have suggested that we make sure our articles are optimized to be read by robots so that they will rank higher on Google. […] Playing the SEO game to some extent has become a necessary chore for journalists […] to stand out and compete within the online news environment that’s increasingly being dog-walked by opaque algorithms that prefer ad-flooded websites and machine friendly keyword trash over real, human-created writing and reporting.

Doch auch die sozialen Medien, bis dato halbwegs zuverlässige Zulieferer an Inhalten interessierter Menschen, liefern nicht mehr, was sie Werbetreibenden und Content-Creatoren versprochen haben. Auch dafür müssten nämlich Inhalte mittlerweile auf eine Art und Weise angepasst werden, die „Engagement“ verursacht, was oft nur möglich ist, in dem man den Ton, die Länge, die Aussage, kurzum sehr vieles am eigentlichen Artikel anpasst. Doch was bliebe in so einem Fall denn von der ursprünglichen Intention eines online veröffentlichten Beitrags noch übrig? Kaum etwas.

Social media platforms […] are an increasingly unreliable way to reach readers because of mass fragmentation, ever-changing algorithms that favor engagement, and the fact that Elon Musk has driven Twitter into the ground. In our careers we have seen business models and editorial strategies rapidly change based on whatever Facebook’s algorithm happens to be doing on any given day […] an ever-changing Black Box algorithm and the whims of a gigantic tech company.

So, da sind wir nun. Ein ambitioniertes Medienprojekt erfolgreicher Journalistinnen und Journalisten wird in gerade mal einem halben Jahr seit Gründung bereits von der Copy-Paste-Technologie namens AI in seiner Existenz zwar noch nicht bedroht, aber doch herausgefordert. Nicht etwa, weil es widerliche Kopiermedien gibt („Alles AI, yeah!“), sondern, weil die Zulieferkanäle ihre Qualitätsansprüche nicht halten können.

Google erweist sich plötzlich längst nicht mehr als die Aufstiegshilfe, die man mit einer Optimierung seiner Inhalte beglücken konnte, um dadurch Leser:innen auf die eigene Website zu bekommen, sondern – und das wird immer mehr zu meinem Eindruck, je mehr Beiträge und (wissenschaftliche) Untersuchungen es zum Thema gibt – als teilweise richtig stupide und nach einem offenbar viel banaleren Algorithmus als gedacht funktionierende Maschine, die originäre Inhalte von AI-generierten Kopien nicht unterscheiden kann. Offenbar, und das kann ich retrospektiv nun behaupten, hat Google in den letzten Jahren seinen Status mehr dem Glauben an und nicht der Tatsache von qualitativ hochwertigen Suchergebnisse zu verdanken. Wenn nämlich von Menschen verfasste Beiträge einem KI-generierten Copy-Paste-Artikel in den Suchergebnissen unterliegen, dann fragt man sich natürlich, was das großspurige Mission-Statement, „to organize the world’s information and make it universally accessible and useful“ eigentlich zu bedeuten hat. Es scheitert ja ganz offensichtlich schon am Verständnis und an der Definition des Begriffs „Information“.

Zurück zu 404 Media, denn das Jammern hilft eh niemandem. Macht, was ich gemacht habe, denn dort ist sehr häufig wirklich guter Content zufinden: Abonniert den Newsletter und wenn euch die Beiträge interessieren, abonniert die Publikation um USD 100/Jahr.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert