[17.3.07] Sun, 30 Nov 2003 01:29:06 +0100: Google und der Bayesianische Filter
Googles neuer Filter (Florida-Update) arbeitet anscheinend nach dem bayesianischen Prinzip
Bogofilter ist ein Bayesianischer Spamfilter. Es ist vollständig in C geschrieben und ist sehr schnell (verglichen mit SpamAssassin). Ein Bayesianischer Filter ist ein statistischer Filter, den du zuerst trainieren mußt, zu lernen, was Spam ist und was kein Spam ist. Du brauchst ca. 100 Trainingseinheiten (sortiert nach Spam und Nicht-Spam) bis der Filter effizient bei neuen Nachrichten funktioniert.
Bogofilter ist schnell, aber er funktioniert nicht vom ersten Tag an wie SpamAssassin. Nach einer Weile ist er so wirkungsvoll wie SpamAssassin und filtert über 90% aller Spam.
Das würde auch die miesen Ergebnisse für einige Keywords erklären - aber dann sollten die sich ja sehr bald verbessern.
Quelle: Seth Finkelstein gefunden bei Klaus Schallhorn
Direkt zum Artikel