Mastodon-User Korrupt hat mich darauf hingewiesen, dass sein Kommentar hier auf meinem Blog nicht und nicht erschienen ist. An sich hatte ich nie Probleme mit Kommentaren. Antispam Bee, ein hervorragend einfaches Antispam-Plugin für Kommentare, verrichtet seit je her hier seinen Dienst und legitime Kommentare wurden bislang problemlos in die Moderationswarteschlange gelegt. Seit einiger Zeit jedoch nicht. Viele Kommentare wurden fälschlicher Weise als Spam markiert.
Ich habe meine Kommentare durchsucht und nicht nur Korrupts Eintrag gefunden, sondern auch noch einige andere, legitime, aber eben als Spam markierte. Sie alle hatten denselben Spam-Grund angeführt: „Lokale Spamdatenbank“. Diese Funktion hat sich in meinem Fall als nicht so toll erwiesen, hat sie doch legitime Kommentare als Spam markiert.
Das resultiert aus dem folgendem Verhalten des Antispam Bee-Plugins, wenn der Filter „lokale Spamdatenbank einbeziehen“ aktiv gesetzt ist:
Antispam Bee gleicht die URL, IP- und E-Mail-Adresse abgegebener Kommentare mit lokal verfügbaren Werten der bereits als Spam gekennzeichneten Kommentare ab […] Existiert im Blog bereits ein Spam-Eintrag mit identischer IP-Adresse, URL oder E-Mail-Adresse, so wird auch dieser Versuch zu kommentieren als Schädling eingestuft und je nach Einstellungen entsprechend behandelt (markiert oder gelöscht).
Dokumentation Antispam Bee
Und siehe da, alle legitimen Kommentare, die als Spam deklariert waren, hatten eine gemeinsamkeit mit hunderten (!) Spam-Kommentaren: die IP-Adressen. Mag sein, dass das an der Pseudonymisierung liegt, die das letzte Oktett auf „123“ setzt oder an sonst etwas, jedenfalls aber fand ich Korrupts Kommentar in einem See aus irgendwelchen, in kyrillischen Schriftzeichen verfassten Nachrichten und anderen, wenig legal wirkende Dienstleistungen bewerbenden „Kommentaren“.
Aber nicht nur seinen Kommentar fand ich da. Auch die Stellungnahmen anderer Personen, die in letzter Zeit legitim kommentiert hatten, sind aus dem gleichen Grund im Spam gelandet. Ich bin sie alle durchgegangen und habe sie nacheinander freigeschaltet und, wo nötig, beantwortet.
Nutzt ihr Antispam Bee, seht doch auch mal nach, ob sich nicht doch legitime Kommentare auch in eurer Spam-Datenbank verstecken. Ich, jedenfalls, habe vorläufig die Option „lokale Spamdatenbank einbeziehen“ deaktiviert, womit dieses Problem gelöst sein sollte.
Aber noch etwas ist mir aufgefallen. Neben ganz offensichtlichem Spam habe ich beim rigorosen Löschen einiger Kommentare kurz zögern müssen. Sie bestanden zu etwa zwei Drittel aus einem Inhalt, der sich, zwar oberflächlich, aber doch, auf den Inhalt des kommentierten Artikels bezog. Allgemeinplätze, die aber auch teilweise von Menschen so oder so ähnlich formuliert werden könnten. Erst im dritten Drittel verriert sich der Kommentar als Spam: Hier fand der Wechsel der Sprache statt, mit einem Link auf eine .ru-Seite mittendrin. Das werden also wohl Kommentare sein, die mittels KI angefertigt wurden. Die Anweisung lautet wohl, halbwegs passende Antworten und Statements zu generieren, eine Überleitung zu Produkt A oder B zu finden, und das dann als Kommentar posten. Alles gelöscht.
> Mag sein, dass das an der Pseudonymisierung liegt, die das letzte Oktett auf „123“ setzt oder an sonst etwas
Es könnte auch die Reihenfolge sein, in der der Code ausgeführt wird. Die Spamprüfung sollte *vor* der Pseudonymisierung erfolgen, nicht danach. Die Funktion abzustellen, lindert jetzt das Symptom, aber repariert nicht die Ursache des Problems.
Korrekt. Aber die Option zu deaktivieren hat praktisch nichts verändert. Spam landet im Spam, aber legitime Kommentare kommen (vorläufig) problemlos durch.
> Aber die Option zu deaktivieren hat praktisch nichts verändert. Spam landet im Spam, aber legitime Kommentare kommen (vorläufig) problemlos durch.
Das wundert mich nicht. Es ist ja ein edge case.
Wenn du eine Pseudonymisierung in der beschriebenen Form zu früh durchführst, dann passt die IP-Adresse häufiger. Es muss jetzt ein Fall auftreten, wo ein paar Dinge zusammenkommen: Gehackte Site aus IP-Raum X versendet Spam und landet bei dir in deinen Spamkommentaren. Bevor diese Spam-Mail ggf. automatisch gelöscht wird, muss nun aus dem gleichen IP-Raum ein legitimer Kommentator kommen.
Das kommt nicht so häufig vor, aber es ist ja schon passiert, denn sonst hättest du den Artikel ja nicht geschrieben.
Durch das Deaktivieren der Funktion in ASB wirst du in 99 % der Fälle den Spam trotzdem abwehren, da der Honeypot in 99 % aller Fälle greift. Für die restlichen 1 % gibt es die anderen Methoden. Und die lokale Spam-DB wäre halt eine gute Ergänzung. So muss bei Spamwellen, die durchkommen, im Bestfall nur der erste Kommentar manuell als Spam markiert werden, um die Welle zu stoppen.
Und ich kann mit dem 1% verbleibenden Spam gut leben. Wie du sagst: Es war ja ein Edge-Case. ASB ist und bleibt mein Nr.1-Plugin für genau solche Sachen. Erstens, weil’s einfach funktioniert und zweitens, weil es eines von ganz wenigen ist, die nicht irgendwohin Daten übertragen, somit gut mit meiner grundsätzlichen Einstellung zu Datenschutz vereinbar.
Was Torsten zum Honeypot sagt, ist aus noch einer Perspektive interessant. Ich hab beim parallelen Nachsehen in oben beschriebener Sache festgestellt, dass ich bei ca. 20 Spamkommentaren die Stunde bin und insofern ein „regelmäßig mal auf false positives checken“ nicht wirklich praktikabel ist, es sei denn, ich schau jedes Wochenende tausende Seiten durch.
Jetzt hab ich die per Honeypot erkannten Spamkommentare zum direktlöschen gegeben, puff, Spam-Aufkommen fällt schlagartig auf ne Nullinie.
Ich kanns weiterempfehlen, bevor man ein „ach, lösch mal alles automatisch nach sieben Tagen“-Default setzt.
Das ist natürlich ein sehr praktikabler Weg. Danke dafür!
Das ist auch unsere empfohlene Konfiguration. Durch Honeypot als Spam erkannte Kommentare sind eigentlich immer Spam. Oder es gibt ein Kompatibilitätsproblem, dann landen alle Kommentare mit diesem Grund im Spam.
Der Wartungsaufwand liegt so bei nahe 0. 👍