Google scheint ein Suchproblem zu haben

Googles Suchergebnisse scheinen unter minderer Qualität zu leiden.

Google’s results might be as good as ever. They might even be better than ever. But if the public perception is that Google has a search quality problem, that wins, because we don’t have any hard figures about relevancy.

Danny Sullivan listet in einem ausführlichen Artikel auf Searchengine Land die vielen Probleme, mit denen Google zu kämpfen hat, auf, und ruft in seiner Conclusio zu kritischem Denken auf.

We should continue to hold Google and search engines to a high standard and highlight where things clearly go wrong. But we should also understand that perfection isn’t going to be possible. That with imperfect search engines, we need to employ more human critical thinking skills alongside the searches we do — and that we teach those to generations to come.

Life itself rarely has “one true answer” to anything. Expecting Google or any search engine to give them is a mistake.

Es scheint also doch noch ein wenig Hoffnung in den menschlichen Intellekt gelegt zu werden.

Unsichtbares CAPTCHA, identifizierbarer Mensch

Google hat vor wenigen Tagen seine CAPTCHA-Technologie verbessert. Für eindeutig menschliche Besucher einer Seite wird die Technologie unsichtbar, nicht eindeutig als Menschen identifizierbare und als Bots angenommene Besucher werden nach wie vor mit verschiedenen Aufgaben konfrontiert, um Mensch endgültig von Maschine unterscheiden zu können.

Was auf der einen Seite gut klingt und einen Fortschritt zu den nervigen Spielchen wie Buchstabenraten, Bilder mit Häuserfronten markieren oder alle Stücke eines Kuchens auswählen darstellt, zeigt auf der anderen Seite, dass ein multinationaler Konzern, der von der Internetleitung über den Domain Name Service, das Webhosting, das Mailhosting oder durch die Integration von StatistiktoolsWerbung oder, wie in diesem Beitrag, Videos ohnedies auf praktisch jeder Website vertreten ist und damit allumfassend Informationen sammeln kann, nun genügend Interaktions- und Verhaltensdaten zusammengetragen hat, um die Arbeit des Separierens von Mensch und Bot/Maschine einer künstlichen Intelligenz zu übergeben, die für den Menschen unsichtbar agiert.

Doch denken wir einen Schritt weiter. Ist diese Separation einmal erledigt und ein menschlicher Nutzer eindeutig vom Bot getrennt, spricht nichts mehr dagegen, die Technologie anderwertig anzuwenden und nicht nur Bot von Mensch, sondern auch Mensch von Mensch zu trennen und damit eindeutig zu identifizieren. Ist erst einmal ein eindeutiges Nutzerprofil, das auf dem Verhalten eines Nutzers basiert, erstellt und ist so einem Nutzer ein eindeutiges Identifikationsmerkmal (im Sinne zB eines Verhaltensprofils) zugeteilt, dann bedarf es nur noch des Faktors Zeit, um diesen Nutzer eindeutig – und zwar namentlich – zu identifizieren oder, aus Sicht des Datensammlers, zu deanonymisieren. Technisch gesehen ist dieser letzte Schritt vorläufig ohne jeglichen Vorteil für ein Unternehmen wie Google. Für die Anzeige von Werbung oder die Analyse von Daten ist der Name nur noch die letzte Illusion menschlicher Würde und bestenfalls für den Abgleich von nicht-elektronisch verfügbaren Daten – an sich eine Illusion – von Nutzen. Alles entscheidend ist die ID.

Mit anderen Worten: Googles unsichtbares CAPTCHA bedeutet, dass Identifikationssysteme keine Interaktion mehr mit Menschen benötigen, um Menschen von Bots unterscheiden zu können. Maschinen, die im Eigentum einer (einzigen) Firma stehen, haben diese Aufgabe übernommen. Und ihr nächstes Ziel ist klar: Menschen von Menschen zu unterscheiden, zu identifizieren und zu bewirtschaften.

Mit Daten bezahlen soll Rechtsansprüche erwirken

Vor 3 Jahren hat man in Frankreich zum ersten Mal davon gesprochen, das Sammeln und Verwerten persönlicher Daten zu besteuern. Die Idee für die Besteuerung basierte auf der Vorstellung, dass der Gewinn von Firmen wie Facebook und Google auf der Verwertung des Rohmaterials „Daten“ basiere und diese Daten letzten Endes von unbezahlten Arbeitskräften, nämlich den Nutzern, erwirtschaftet wurden. Die Steuer würde also auf die (unbezahlte) Arbeitsleistung abzielen.

Je nach Sichtweise im Widerspruch oder ergänzend dazu hat sich spätestens seit Jaron Laniers „Who owns the future“ die Phrase „mit Daten bezahlen“ etabliert. Sie meint, dass es ein symbiotisches Verhältnis zwischen dem einzelnen Nutzer/der einzelnen Nutzerin und dem Service, der die persönlichen Daten nutzt, gibt: Ich kann einen der besten Mailservices der Welt kostenlos nutzen (Gmail), dafür darf Google Daten aus meinen E-Mails in seine Profiling-Maschinerie aufnehmen. Ich kann Statusmeldungen schreiben, Bilder, Videos und Links mit anderen Teilen (Facebook), dafür darf Facebook Analysen über mein in Facebook abgebildetes Leben erstellen und damit Geld verdienen. Die Vorstellung des symbiotischen Verhältnisses basiert jedoch auf Freiwilligkeit und auf einer ex post-Wahrnehmung des Verhältnisses als „Vertrag“, den ich mit dem Anbieter eines Services eingehe. Genau diese Vorstellung ist nun an einem Punkt angelangt, wo sie in das Vokabular der Rechtsprechung übergeleitet werden soll.

„Mit Daten bezahlen“ soll hinkünftig nicht mehr die Ohnmacht ausdrücken, die ein Einzelner gegenüber einem Konzern wie Facebook oder Google entgegenbringt, sondern ins juristische Konzept des „Entgelts“ übernommen werden. Das bedeutet: Nutzer haben plötzlich Rechtsansprüche.

Mit Daten bezahlen

Wieso erwirtschaften „kostenlose“ Dienste wie Facebook (oder Gmail) so dermaßen hohe Gewinne? Weil sie die Leistung vieler nahezu kostenlos extrahieren und als Interesse für wenige verkaufen. Oder, aus Sicht der Produkte, äh, Nutzer:

So what does it really mean, then, to pay with data? Something subtler is going on than with the more traditional means of payment. Jaron Lanier […] sees our personal data not unlike labor—you don’t lose by giving it away, but if you don’t get anything back you’re not receiving what you deserve. Information, he points out, is inherently valuable. When billions of people hand data over to just a few companies, the effect is a giant wealth transfer from the many to the few.

Das erklärt womöglich auch, warum die immer wieder aufkommende Idee von Micropayments, mit denen Dienste wie Facebook oder Gmail für ihre User werbefrei und mit angemessenem Datenschutz zu nutzen wären, bei den Diensten selbst auf taube Ohren stoßen. Viel zu viel ist das gegenwärtig verfügbare Datenrohmaterial und viel zu viel das in Zukunft daraus erwachsende Wissen wert.

The two-hundred-and-seventy-billion-dollar valuation of Facebook, which made a profit of three billion dollars last year, is based on some faith that piling up all of that data has value in and of itself. It’s like a virtual Fort Knox—with a gold mine attached to it. One reason Mark Zuckerberg is so rich is that the stock market assumes that, at some point, he’ll figure out a new way to extract profit from all the data he’s accumulated about us.

„Livestock“ erhält eine völlig neue Bedeutung.

Wie Gmail funktioniert

Alle, die verstehen wollen, wie Gmail funktioniert, lesen jetzt Jeff Goulds „The Natural History of Gmail Data Mining„. Keine Sorge, hier lamentiert niemand über das Offensichtliche. Vielmehr ist der Artikel ein Lehrbuchbeispiel für präzises Planen, strategisches Handeln und situationsgerechtes, weil faktenbasiertes, auf Argumentation und Abwägung aufbauendes Entscheiden. Ein Beispiel (von vielen):

The most striking thing about the early Gmail patents is how exhaustive they were in attempting to anticipate every conceivable attribute of an email message that might one day be exploited for ad targeting purposes. In many cases it would be years before Google was actually able to make these ideas operational in Gmail. The first version of ad serving in Gmail exploited only concepts directly extracted from message texts and did little or no user profiling — this method would only be put into practice much later. Some attributes have still not been implemented today and perhaps never will be. For example, as far as I know, Google does not reach into your PC’s file system to examine other files residing in the same directory as the file you attach to a Gmail message, even though the patents explicitly describe this possibility.

Jeff Goulds Artikel fasziniert. Und doch darf man nicht vergessen, dass es hier um Werte geht (im konkreten Fall um 60 Milliarden US-Dollar), die aus Daten extrahiert werden, die niemand zu verbergen braucht, weil niemand was zu verheimlichen hat. Stattdessen halt herschenken.

Scott Galloway über Amazon, Apple, Facebook und Google

Scott Galloway spricht über die „Four Horsemen: Amazon, Apple, Facebook and Google“, zeigt dabei in 16 Minuten knapp 90 Folien, deklariert Amazon als bereits am absteigenden Ast, Facebook als reinen Bauernfang, WhatsApp als besten und Tumblr als schlechtesten Kauf der Internetgeschichte, Googles Geschäftsmodell als überholt und Apple als trendigen Katalysator zur erfolgreichen Vermehrung. Der superschnelle Vortrag lohnt sich. Er ist witzig und schonungslos, so zum Beispiel:

Facebook has pulled off the greatest bait-and-switch in marketing history. They convinced many of the brands in this room to spend hundreds of millions to build their communities telling them that would be their community and they would have access to it. They then put a walled garden around it, and said „just kidding“! You have to pay for access to that community. The organic reach on Facebook is now 6 percent. Meaning that if you are Procter & Gamble and you want to speak to the community that you paid to build, 1 in 16 messages will actually reach them. They are telling clients that they should assume organic reach of zero.

Mehrwert in Geburtstagsgrüßen

Wer auf einen Geburtstagshinweis eines sozialen Netzwerks reagiert, bestätigt und bestärkt den Grad an „Freundschaft“.

It was my birthday recently. […] Google Plus, the zombie social network I have barely used since its launch in 2011, alerted my contacts that have Android phones. And anyone with iCal synced to Google Calendar had it marked in their iPhones. […] My guess is that Google set up the alert to calibrate the affinity score of everyone who sent me a message with „birthday“ in the email. Those who contacted me that day are now marked as stronger connections than those who didn’t. The Facebook algorithms […] must factor in birthday engagement […] when calculating the affinity score of the relationships of users.

Zu Inhaltsleere, Langeweile und Stress gesellt sich also auch noch der Algorithmus. Der Geburtstag wird auf ein Mittel zum Werbezweck reduziert. Was für ein Fest! (Fast wie Weihnachten.)

Wie lebt es sich ohne Google?

Julia Angwin beschließt, Google nicht mehr zu benützen. Über die Beweggründe, Ängste, Herausforderungen und Erfahrungen hat sie ein Buch geschrieben – Dragnet Nation. Auch nicht wenig spannend ist, wie sich das Leben nach Google darstellt und welche Veränderungen (und „Anstrengungen“) ein nicht-assistiertes Leben zutage bringt.

As soon as I switched, I realized how dependent on Google I had become. Without Google’s suggested searches and perfect memory of what I usually search for, each search required more work from me. For instance, DuckDuckGo doesn’t know that I live in New York City, so when I mistyped “Naturaly History Museum,” it brought up the Natural History Museum of Los Angeles. For a comparison, I checked Google — and sure enough, it corrected my spelling and guessed I was in New York, listing the American Museum of Natural History in Manhattan at the top of my search results.

DuckDuckGo’s lack of knowledge about me forced me to be smarter in my searches. For instance, I noticed I had become so lazy that I had been typing URLs — like CNN.com — into the Google Search bar instead of the navigation bar, even though I knew exactly where I was going. So I began typing the addresses into the correct spot on my web browser.

Google ist deshalb so erfolgreich, weil es uns dort trifft, wo wir uns nicht wehren wollen: Google nutzt unsere Bequemlichkeit aus. Und das kann ich sogar noch mit zwei weiteren Beispiel belegen: Auf der letzten CryptoParty (!) lobte ein Bekannter Google Chrome, weil sich der Browser so angenehm an seine Gewohnheiten anpasste. Ein anderer Freund erzählt mir immer wieder, wie einfach und problemlos in seiner Firma alle E-Mails, Dokumente und Kalendereinträge über die Google Cloud verwaltet werden; nirgendwo wäre das so einfach möglich. Und so bequem.

Google Webfonts in WordPress 3.8+ deaktivieren

Schon kurz nach Erscheinen von WordPress 3.8 (und nun haben wir schon 3.8.1!) wollte ich auf diesen Artikel von Wolfgang Wiese verlinken, der auf eine Datenschutzlücke im WordPress 3.8-Core hinweist: Die im Backend verwendete Schrift „Open Sans“ wird direkt von Google-Servern geladen. Und das ist ein Problem, weil Google…

dessen Kerngeschäft der Handel mit Metadaten […] ist, hier eine weitere “Tracking-Station” erhält: Der Zugriff des Users wird getrackt, wobei mindestens die Header-Daten des Connection-Requests übermittelt werden. Dazu gehören dann auch Cookies von der Google-Domain. Google erfährt hier, dass jemand […] eine Beziehung zur Site hat. Das ist das eine.

Google ist aber nicht nur auf dieser Website. Auch andere Websites nutzen Google Webfonts. […] Google [kann dadurch] sehen, wenn sich ein Account […] bei der einen Website anmeldet oder die andere Website schlicht nur aufruft. Ruft der Account letztendlich auch noch eine Website auf, bei der Google dann persönliche Daten mit diesem Account verbinden kann (z.B. Google Plus oder der Login bei YouTube), weiß die Firma auch, wer dann hinter dem Account steht.

Zum Glück ist die Lösung des Problems einfach: Disable Google Fonts installieren und aktivieren; damit wird das Laden der Schrift von Google unterbunden. Wem die nun in einer Fallback-Schriftart erscheinende WordPress-Administrationsoberfläche zu spartanisch ist, kann – danke für den Hinweis an Sergej Müllers WP Letter No. 88 – die Schriftart „Open Sans“ lokal installieren (und damit vom Computer aus laden).

Privatsphäre – (Suche + Mail + …) = 2,2 Mrd. Euro

Bruce Schneiers Beitrag zur „Überwachung als Geschäftsmodell“ zusammengefasst? „Kostenlos“ ist ein Wert, mit dem Menschen nichts anfangen können, weil sie über den Wert der Daten, die sie freiwillig hergeben, nicht bescheid wissen. Oder anders:

Google’s 2013 third quarter profits were nearly $3 billion; that profit is the difference between how much our privacy is worth and the cost of the services we receive in exchange for it.

In anderen Worten: Google hat von Juli bis September 2013 einen Gewinn von (umgerechnet) 2,2 Milliarden Euro verzeichnet. Der Gewinn wird aus dem Wert persönlicher Daten und Verhaltensweisen von Google- (und Nicht-Google-) Benutzern abzüglich der Ausgaben fürs Betreiben einer Suchmaschine, eines E-Maildienstes, Rechenzentren, etc., berechnet.

Dein Profil in Google-Werbung?

Es empfiehlt sich, die für 11. November 2013 angekündigten und wieder einmal geänderten Nutzungsbedingungen von Google durchzulesen.

Bei geteilten Empfehlungen in Anzeigen können Sie anhand der Einstellung für geteilte Empfehlungen entscheiden, ob Ihr Profilname und Foto verwendet werden darf. Wenn diese Einstellung nicht aktiviert ist, werden Ihr Profilname und Foto weder in der Anzeige für Ihre Lieblingsbäckerei noch in anderen Anzeigen verwendet.

Scheinbar funktioniert das Nutzen der Nutzer als unbezahlte Testimonials so gut, dass Google es Facebook unverhohlen gleichtut.

Googles Einfluss ist der stärkste. Und der zweitstärkste.

Die drei großen Player im „Zeitalter der Internet-Imperien„: Google, Facebook und Baidu. Google schießt allerdings den Vogel ab.

The power of Google on the Internet becomes starkly evident if we also look at the second most visited website in every country. Among the 50 countries that have Facebook listed as the most visited visited website, 36 of them have Google as the second most visited, and the remaining 14 countries list YouTube (currently owned by Google). […] The countries where Google is the most visited website account for half of the entire Internet population, with over one billion people, as illustrated in the map below.

Okay, noch einmal: Google ist die am häufigsten und am zweithäufigsten besuchte Website der Welt.