2005年04月10日

日本語スパム退治のススメ(1)

基本的に.comなアドレスや.netなアドレスをメインに使っているおかげでこれまでは

  • 英語メール→スパム
  • 日本語メール→必要な物
と言う棲み分けができていたのですが、最近はスパマーも日本語ページにあるメールアドレスにはとりあえず全て送りつけるという方針に切り換えたようで、1度でも晒したメインのメールアドレスにはほぼ例外なくじわじわspamが届くようになりました。

ただ、これまでほとんど日本語spamの撃退経験が無いうちのbogofilterはそれらをほとんど素通しして役に立たず・・・

なので意を決して、晒し用に使っていたフリーのメールアドレス(日本語スパムも当然多数来る)をメインアドレスへの転送設定に切り換えてbogofilterへの学習強化を図ることにしました。

で、最初の3日間ぐらいはほぼ全て筒抜けという状態で、いちいち-Nsオプションで最学習する日々が続きましたが、その後徐々に効果が出てきて、3週間ほどたった現在は大体7割前後の確率で落としてくれるようになりました。

それでも、日に3通程度はまだコンスタントに抜けてきちゃいます。
これがせめてspam確率8割ぐらいなら閾値変更で乗り切れるのですが、現状では抜けてくる3通は5割程度と言う評価なため、閾値ではどうしようも無い感じです。

なので、bogofilterが自信がないときにUnsureと言う評価を出すことを利用して次善処理を行うことにしてみることとしました。

ただ、実装したてで実績がほとんど無いので、数日動かしてちゃんと落とせている用なら、またエントリとしてまとめたいと思います。

Posted by Takuchan at 2005年04月10日 14:47 | トラックバック(0)