以下省略!

タイダルウ(ry ほぼ毎日1記事執筆運動実施中。 ※記事に広告(アフィリエイト)リンクを掲載している場合があります。

2016-05-16

bsfilterでもspamを学習させてみる実験

f:id:abyssluke:20160516160329p:plain:w200:left 受信したspamメール等はsylfilterで意味もなく学習させているが、今日bsfilterも入れて意味もなく学習させているのは秘密。今まで受信した通常メール・spamメール*1を食わせてはいるが、日本語spamの判定精度が微妙な所か(判定値が0.500000前後となる場合が多い)。jtokenizerの設定がデフォルトのbigramな影響なのかは知らんが。あえてmecabで学習しなおした方がいいのかなぁ。調教すればするほど精度は上がるけど。 ※記事画像はWayback Machineを利用し公式サイトが存在していた時代のものをキャプチャしている。現在はOSDNのプロジェクトページしかない上に開発止まっているっぽい

*1:spam収集実験アドレスで受信したspamメールや、かなり昔のspamメールも含む