受信したspamメール等はsylfilterで意味もなく学習させているが、今日bsfilterも入れて意味もなく学習させているのは秘密。今まで受信した通常メール・spamメール*1を食わせてはいるが、日本語spamの判定精度が微妙な所か(判定値が0.500000前後となる場合が多い)。jtokenizerの設定がデフォルトのbigramな影響なのかは知らんが。あえてmecabで学習しなおした方がいいのかなぁ。調教すればするほど精度は上がるけど。 ※記事画像はWayback Machineを利用し公式サイトが存在していた時代のものをキャプチャしている。現在はOSDNのプロジェクトページしかない上に開発止まっているっぽい