YouTube radikalisiert also nicht?

Mark Ledwich und Anna Zaitsev kommen in einem neuen Paper zu dem Schluss, dass der YouTube-Empfehlungsalgorithmus keinen Beitrag zur Radikalisierung leistet.

The role that YouTube and its behind-the-scenes recommendation algorithm plays in encouraging online radicalization has been suggested by both journalists and academics alike.

Automatisierte Stills bei Netflix

Im Netflix Technology Blog berichtet man stolz über die automatisierte Extraktion von Stills aus Serienepisoden, um ein passendes Symbolbild für die Browsing-Ansicht zu finden. Das Technologieteam nennt Kriterien und Maßstäbe, mit denen Bilder gefunden, bewertet und sortiert werden, aber erwähnt mit keinem Wort in meinen Augen ganz zentrale Punkte wie den Inhalt oder die Stimmung der jeweiligen Episode. Was Netflix einem Nutzer oder einer Nutzerin in der Angebotsübersicht also anzeigt, ist ein Bild aus der jeweiligen Episode, aber kein Symbolbild für ihren Inhalt. Und da wundert sich noch irgendwer, warum das Finden interessanter Angebote auf Netflix so überhaupt nicht funktioniert?

Zumindest bei mir ist es so, dass mich das wohl vollautomatisierte Marketing auf Netflix noch nie von einem Film oder einer Serie überzeugt hat, wenn nicht in Form einer Erinnerung an ein Angebot, das ich bereits kannte (und wiedersehen wollte); immer waren es Kritiken und Rezensionen, die in der Onlineversion einer Zeitung oder eines Magazins erschienen sind, welche mich zu neuen Filmen und Serien brachten.

Welches Smartphone schläft neben welchem Smartphone

Der „Monolog des Algorithmus“ der Panoptykon Foundation ist ein schauriger Einblick in die Verarbeitung eines Bruchteils der Daten, die Facebook nutzt, um seine Userinnen und User in Profit umzuwandeln. Die Frage „Welches Smartphone schläft neben welchem Smartphone?“ macht schon deutlich, wie aus ein paar wenigen Abstraktionen (Besitzer/Besitzerin des Smartphones + Geodaten = Beziehung) Facebook bereits auf konkrete Lebensumstände schließen kann.

Das Video haut mich zwar nicht vom Hocker, aber es soll denjenigen als Erinnerung dienen, die mittlerweile bereits vergessen haben, dass jede einzelne ihrer Aktionen (Likes, Scrollen, Lesen… Interagieren im weitesten Sinn) protokolliert, ausgewertet und in verwertbare Daten (also in ein Produkt, das Werbekunden verkauft werden kann) konvertiert wird.

Lohnt es sich, einen Patienten am Leben zu erhalten?

Die Firma Aspire Health wirbt damit, einen Algorithmus entwickelt zu haben, der voraussagen kann, ob es sich lohnt (ja, finanziell lohnt!), einen Patienten durch Behandlung am Leben zu erhalten oder ihn gleich in die Palliativpflege abzuschieben. Zitat aus dem äußerst lesenswerten Beitrag dazu auf tagesschau.de:

Das von Google mitfinanzierte Unternehmen wertet mithilfe von Algorithmen ärztliche Diagnosen von Patienten aus und gleicht das Krankheitsbild mit Mustern häufiger Therapien ab. So soll verhindert werden, dass Schwerkranke unnötige Behandlungen bekommen, die außerdem noch viel Geld kosten. Das spart teure Untersuchungen, wenn man zu wissen glaubt, dass es ohnehin bald um den Patienten geschehen ist.

Twitter-Thread.

Algorithmen sind kodifizierte Meinungen

Cathy O’Neil über den Marketing-Trick „Algorithmus“ und seine falschen Versprechungen, objektive und neutrale Ergebnisse zu liefern.

Algorithms are opinions embedded in code. It’s really different from what you think most people think of algorithms. They think algorithms are objective and true and scientific. That’s a marketing trick. It’s also a marketing trick to intimidate you with algorithms, to make you trust and fear algorithms because you trust and fear mathematics. A lot can go wrong when we put blind faith in big data. […] Algorithms […] don’t make things fair. They repeat our past practices, our patterns. They automate the status quo. That would be great if we had a perfect world, but we don’t. And I’ll add that most companies don’t have embarrassing lawsuits, but the data scientists in those companies are told to follow the data, to focus on accuracy. Think about what that means. Because we all have bias, it means they could be codifying sexism or any other kind of bigotry.

(via Robert Harm)

Wie sortiert man Bücher am schnellsten alphabetisch?

What's the fastest way to alphabetize your bookshelf? - Chand John

In diesem Video wird anhand der Sortierung einer Buchlieferung von 1.280 Büchern an eine Bibliothek dargestellt, wie die 3 Sortieralgorithmen Bubble Sort, Insertion Sort und Quick Sort funktionieren. Die Aufgabe: Der Bibliothekar soll 1.280 Bücher so rasch als möglich alphabetisch sortieren.

Im ersten Verfahren wird jedes Buch mit seinem Nachbarn auf der linken Seite verglichen. Ist das rechte Buch im Alphabet früher angesiedelt als das linke, werden deren Plätze vertauscht. Der Prozess wird solange wiederholt, bis es kein Buch mehr gibt, zu dessen Linken sich ein im Alphabet nachgestelltes Buch befindet. Diese Form der Sortierung wird „Bubble Sort“ genannt und benötigt für alle 1.280 Bücher 818.560 Vergleiche. Bubble Sort ist einfach, aber enorm Zeitaufwändig, weil fast alle Bücher mit fast allen anderen verglichen werden.

Das zweite Verfahren – Insertion Sort – beginnt zwar gleich wie das Bubble Sort-Verfahren, doch wird der Vergleich nach links hin fortgesetzt. Wenn das Buch an Position 5 im Alphabet dem Buch an der Position 4 im Alphabet vorangestellt ist, so werden die Positionen der beiden vertauscht. Hier hört der Vergleich aber nicht auf, denn das Buch wird auch gleich mit den Büchern auf den Positionen 1-3 vergleichen und auch gleich korrekt einsortiert. Dieses Verfahren reduziert die Anzahl der Vergleiche um die Hälfte, also auf 409.280.

Die dritte und effizienteste Methode ist das QuickSort-Verfahren. Hierbei wird irgendein Buch aus der Mitte ausgewählt. Von diesem Buch ausgehend, werden alle im Alphabet nachgestellten Titel rechts von dem Buch angeordnet, die im Alphabet vorangestellten links davon. Die zwei nun entstandenen Blöcke werden abermals jeweils halbiert und innerhalb der beiden Hälften wird ebenso nach im Alphabet vorangestellt oder nachgestellt sortiert. Die QuickSort-Methode ermöglicht es, die direkten Vergleiche auf ein Minimum zu reduzieren, weil große Gruppen von Büchern auf einmal miteinander verglichen werden. Mit dieser Methode wird die Anzahl der Vergleiche auf 11.776 reduziert. Das sind etwa eineinhalb Prozent der Menge des Bubble Sort-Verfahrens!

Dein Facebook-Stream: Hochzeiten, Kinder und Katzen

The Problem With Facebook

Welche Beiträge Anderer ein Facebook-Nutzer sieht, wird nicht durch natürliche Faktoren (wie Zeit oder die Onlinepräsenz von Freunden), sondern von einem Facebook-Algorithmus bestimmt. Die Mathematik dahinter ist sogar nachvollziehbar: Ein User wäre, wenn er sich ein Mal pro Tag bei Facebook anmeldet, im Schnitt mehr als 1.500 neuen Beiträgen ausgesetzt – viel zu viel Input, den ein User verarbeiten müsste. Facebooks Algorithmus reduziert diese Beiträge auf einige wenige, die für den User höchstwahrscheinlich von Interesse sind. Somit ist, was viele als natürlich wahrnehmen, eine auf persönliche Interessen zugeschnittene Abfolge von Inputs, die zu Interaktion animieren soll: Hochzeiten („Ah, wie schön!“), Fotos von Kindern („Oh, wie herzig!“) und von Katzen („So ein liebes Tierchen!“).

Der Nachteil dieses Systems ist zugleich Facebooks Geschäftsmodell: Generiert ein Beitrag genügend Interesse (und Interaktion) unter Usern, enthält er also dem Inhalt des Beitrags entspringende, originäre Zugkraft, so wird er durch den Facebook-Algorithmus künstlich zurückgehalten und in seiner natürlichen Wirksamkeit eingeschränkt. Hat aber der Autor des Beitrags Interesse daran, den Beitrag doch größeren Nutzergruppen verfügbar zu machen, so muss er für die Promotion des Beitrags zahlen. Mit Zahlung eines bestimmten Betrags werden Beiträge, die andere Nutzer natürlich erreichen würden, künstlich in deren Filter Bubbles auf Facebook injiziert.

Eigentlich keine blöde Idee, Herr Zuckerberg. Keine blöde Idee.

Vorteile errechneter Suchergebnisse

In einem Artikel, der zu den Vorwürfen der Manipulation von Suchergebnissen bei Google Stellung nimmt, erklärt Amit Singhal, warum man bei Google auf durch Algorithmen errechnete Suchergebnisse setzt und nicht, wie zB Facebook das plant, auf durch User ausgewählte.

The web is built by people. You are the ones creating pages and linking to pages. We are utilizing all this human contribution through our algorithms to order and rank our results. We think that’s a much better solution than a hand-arranged one. Other search engines approach this differently – selecting some results one at a time, manually curating what you see on the page. We believe that approach which relies heavily on an individual’s tastes and preferences just doesn’t produce the quality and relevant ranking that our algorithms do. And given the hundreds of millions of queries we have to handle every day, it wouldn’t be feasible to handle each by hand anyway.