Ein Team der Universität Leipzig, der Bauhaus-Universität Weimar und des ScaDS.AI (was auch immer das ist1) hat sich mit der auch hier schon öfter gestellten Frage, „Is Google Getting Worse?“ auseinandergesetzt. Aus dem Abstract:
Many users of web search engines have been complaining in recent years about the supposedly decreasing quality of search results. This is often attributed to an increasing amount of search-engine optimized but low-quality content. Evidence for this has always been anecdotal, yet it’s not unreasonable to think that popular online marketing strategies such as affiliate marketing incentivize the mass production of such content to maximize clicks. […] We monitored Google, Bing and DuckDuckGo for a year on 7,392 product review queries. Our findings suggest that all search engines have significant problems with highly optimized (affiliate) content—more than is representative for the entire web according to a baseline retrieval system
Is Google Getting Worse? (pdf)
on the ClueWeb22. Focussing on the product review genre, we find that only a small portion of product reviews on the web uses affiliate marketing, but the majority of all search results do. […] We further observe an inverse relationship between affiliate marketing use and content complexity, and that all search engines fall victim to large-scale affiliate link spam campaigns. However, we also notice that the line between benign content and spam in the form of content and link farms becomes increasingly blurry—a situation that will surely worsen in the wake of generative AI. We conclude that dynamic adversarial spam in the form of low-quality, mass-produced commercial content deserves more attention.
Gerade der letzte Teil, in dem die Wissenschaftler die immer schwieriger auszumachende Trennlinie zwischen hochwertigem Content und solchem, der nur dem Verkaufszweck dient – sie nennen ihn ohne mit der Wimper zu zucken „Spam in Form von Content“ (I like!) – beklagen und auf die Gefahr von mit generativer KI erstelltem Content, der die Trennung schwieriger macht und somit die Unschärfe vergrößert, hinweisen, sehe ich auch als große und aufgrund ihrer tiefgreifenden und nachhaltige Veränderungen im Schreibverhalten verursachenden Wirkung als lang nachwirkende Gefahr zumindest für die nächsten Jahre. Es wird kein schönes Web sein, mit dem wir in den nächsten Jahren zu tun haben werden. Und ja, ich bezeichne die sinkende Qualität der Suchergebnisse aufgrund der sinkenden Qualität der ihr zugrunde liegenden Inhalte als Gefahr an.
Hier der Link zum PDF. Und hier eine kleine Linksammlung meines Jammerns zum Thema schlechter werdende Suchergebnisse bei Google:
- Die erste Erwähnung hier, dass Google ein Suchproblem zu haben scheint, ist aus 2017.
- Vor ein paar Jahren ist einigen Personen bereits aufgefallen, dass „die erste Google-Suchergebnisseite nicht mehr ‚frei‘“ ist: Waren dort anfangs noch gut recherchierte Beiträge vor allem nicht kommerzieller Websites, wie zum Beispiel privater Blogs, zu finden, sind dort heute praktisch nur noch Angebote von Unternehmen präsent.
- In „Texte eh nur noch für Google“ beklage ich, dass die Verschlechterung der Suchergebnisse praktisch direkt mit Optimierungsversuchen seitens der Betreiber von Websites einhergeht.
- In „Google fällt mehr und mehr“ beschreibe ich nahezu identisch das, was die Wissenschaftler nun bestätigt haben: Google kann nicht mehr zwischen echtem Content und Content-Farmen unterscheiden.
- Wenn die Kernkompetenz von Google mehr und mehr verloren geht, kann man dann Googles Suchergebnissen noch vertrauen? Qualitätsverlust ist eine Sache, gänzlich darauf zu verzichten, Google als Synonym für „die Suchmaschine“ anzusehen, weil dort nur noch nach Spam riechende Inhalte angezeigt werden, ist eine völlig andere Qualität.
- Google hat ein gewaltiges Problem mit der Auswahl der Suchergebnisse und muss sich durch ChatGPT herausgefordert sehen, denn ChatGPT liefert Antworten und zeigt nicht eine Suchergebnisseite (mit schlechten Ergebnissen) an, die ich als Mensch erst recht auf das passende Ergebnis hin durchsuchen muss.
Neue Beiträge werden wie gewohnt mit dem Schlagwort #suchergebnisse getaggt, so auch dieser, daher habe ich den Begriff auch zur entsprechenden Archivseite verlinkt.
- ScaDS.AI ist das Center for Scalable Data Analytics and Artificial Intelligence Dresden/Leipzig. Total cool, wenn man erst googeln muss, was Namen bedeuten. Überhaupt kein Marketing-Problem. ↩︎