ベイジアン・フィルタのメール以外への適用可能性

ベイジアン・フィルタと言えば、今やspamメール対策の主力として各種メーラーに付属している機能である。
私は統計学には詳しくないが、理解の及ぶ範囲でベイジアン・フィルタの機能を端的に説明すれば、以下のようになろう。


ベイジアン・フィルタの基本的な考え方は「あるspamメールに含まれる言葉は他のspamメールにも含まれている可能性が高い」というものである。
ベイジアン・フィルタはこれまでに受信したメールを走査し、受信者がspamと判断したメールとそうでないメールを分けて単語データベースを作る。
これを元に新たに受信したメールを走査し、spamにのみ含まれる単語の頻度が高ければspamと、そうでなければ正しいメールと判断する。


これは何もspamメール判別に限ったものではない。少なくとも文字列であれば何であれ有効だろうし、解析のルーチンさえ別途用意すれば画像だろうと音声だろうと、一定ルールに従い分類できるだろう。現にベイジアン・フィルタを元にした人狼発見機などが作られている。
で、ちょっと考えたのは、これを利用したインターネットフィルタなり2chブラウザなりが登場しないだろうか、ということ。
例えばブラウジング中に「見たくない/見せたくなページ」を開いたら「spam」ボタンをクリック、その蓄積を元にページをブロックするキッズフィルタとか、荒らし認定レスを学習して自動あぼーんする2chリーダとか。spamだけでなく、逆に特定情報を効率良く抽出することも可能に思える。その他、書き込みに対し適切に応答する人工無能だっていけそうだ。


ユーザごとの閲覧エントリを記録しておいて好みそうなエントリをお勧めしてくるはてなブックマークとか。どうですか?>id:hatenadiary