Die Financial Times hat eine richtig gut gemachte Page, auf der interaktiv erklärt wird, wie ChatGPT funktioniert, was ein Large Language Model (LLM), ein Token oder das Transformer Model ist, wieso man nicht wirklich von künstlicher Intelligenz, sondern mehr von einer Art Maschine, die Texte auf Basis hochgradig perfektionierter statistischer Wahrscheinlichkeiten erstellen kann, wenn man über ChatGPT spricht.
Das ist der Artikel für Freundinnen und Freunde des Scrollens und des Betrachtens von durchs Scrollen ausgelösten Animationen. Ein kurzer Einblick, was da eigentlich passiert.
Wer es etwas genauer haben will und vor ein ganz klein wenig Mathematik, Tabellen und Diagrammen nicht zurückschreckt, sollte sich aber im Anschluss Stephen Wolframs Artikel „What is ChatGPT doing… and why does it work?“ durchlesen.
That ChatGPT can automatically generate something that reads even superficially like human-written text is remarkable, and unexpected. But how does it do it? And why does it work? My purpose here is to give a rough outline of what’s going on inside ChatGPT—and then to explore why it is that it can do so well in producing what we might consider to be meaningful text. […] The first thing to explain is that what ChatGPT is always fundamentally trying to do is to produce a “reasonable continuation” of whatever text it’s got so far, where by “reasonable” we mean “what one might expect someone to write after seeing what people have written on billions of webpages, etc.”
Stephen Wolfram
Ich denke, ein wenig Wissen über Künstliche Intelligenz – oder zumindest über das, was wir, eigentlich fälschlicher Weise, als solche bezeichnen – ist im Jahr 2023 Allgemeinbildung. Also lest, lernt, wisst!