Also doch auch via Jetpack verbundene, mit WordPress betriebene Websites?

Es scheint, dass doch auch Daten von via Jetpack mit WordPress.com verbundenen Websites mitverkauft wurden.

Es scheint, dass also doch auch Daten von selbst gehosteten WordPress-Instanzen, die via Jetpack-Plugin mit WordPress.com verbunden sind, auf die eine oder andere Weise Dritten zur weiteren Verarbeitung zur Verfügung gestellt wurden. Nicht unbedingt an Unternehmen, die unmittelbar im Bereich der KI tätig sind, dafür aber zum Beispiel an ein Unternehmen, das die Daten wie eine Art Zwischenhändler für Firmen aufbereitet, die dann damit ihre AI-Modelle trainieren.

Die relevante Schnittstelle ist ein Sammelfeed aller auf WordPress.com – und offenbar auch auf via Jetpack verbundenen Websites – veröffentlichten Artikel, die als „Firehose“ bezeichnet wird. Diese Firehose streamt etwa eine Million (!) Beiträge, die größtenteils von Menschen geschrieben wurden, pro Tag. Dass das lukrativ sein kann, liegt auf der Hand.

Automattic has been selling access to this “firehose” of posts for years, for a variety of purposes. […] This firehose appears to be distinct from any direct data sharing deal with Midjourney and OpenAI, in part because the documentation makes clear that data being sold via this firehose is not limited only to posts on WordPress.com, but also can include posts on self-hosted WordPress.org websites that use Jetpack, a wildly popular plugin that millions of sites use and that users are encouraged to install when setting up a WordPress site. The documentation says that Jetpack sites are subject to a “separate” feed of posts, and SocialGist advertises posts not just from WordPress.com but also from “popular WP-powered sites across the web.” Automattic has stressed, meanwhile, that Jetpack sites are not a part of its deals with “select AI companies.”

404 Media

Unterstützt wird diese Behauptung von der Website des die Firehose verarbeitenden Unternehmens, SocialGist. Auf der „Data Sources“-Seite findet sich ein kleiner Banner, auf dem man lesen kann

Posts, comments and likes from the world’s most popular blogging platform, including WordPress.com and popular WP-powered sites around the web.

Also ich weiß nicht, wie sich Automattic da herausreden will…

Wer etwas zu verbergen hat, macht es in AGB und anderen „Terms of Service“. Jeder Mensch auf diesem Planeten weiß, dass sich niemand, absolut niemand AGB und andere, mit Rechtstexten vollgepfropfte Seiten durchliest. Niemand. Dass wir alle bei diesem fast schon idiotischen Spiel mitspielen, wundert uns alle und doch nutzen wir diese Textwüsten, für die kein Anwalt auf diesem Planeten gradestehen möchte, weil ohnehin allen klar ist, dass sich niemand auskennt. Wenn man also die Nutzung von Daten verkaufen will, dann ist die zugehörige Regel dort am allerbesten aufgehoben, wie man auch bei 404 Media eindeutig festhält.

Data sharing like this is made possible by clauses buried in terms of service agreements that people don’t read, and can sometimes be opted out of in settings pages that most people often don’t look at. These clauses then enable the sale of user data to business-to-business companies who specialize in hoovering up and analyzing data from every surface you could possibly think of. And as in the case of the Automattic news this week, it doesn’t matter anymore if you do read the fine print of privacy policies; platforms can change those terms anytime, make you opt out rather than opt in, and call it “protecting user choice.”

404 Media

Ich kann nur wiederholen, was ich im vorigen Artikel zum Vertrauensverlust in Automattic geschrieben habe: Es ist ein große und bittere Enttäuschung, das alles. Auch wenn die Unternehmen, die Zugang zu meinen/unseren von Hand geschriebenen Beiträgen erhalten haben, nicht unmittelbar im Bereich von KI tätig sind.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert