迷惑メールに効果てきめん!使うほどに賢くなる!「Shuriken」が搭載する「学習型迷惑メールフィルター」とは?
ジャストシステムの高度な日本語形態素解析(*)エンジンを組み込んだメールフィルターです。
めんどうな条件設定は不要。 ドラッグ&ドロップなどで「迷惑メールフォルダ」に振り分けたメールの特徴を学習し、次回以降は自動的に排除します。
単純に文字列で比較するフィルターとは異なり、類似する特徴を持つ迷惑メールも賢く判別します。見出しなどのヘッダ情報だけでなく、メール本文や添付ファイルの内容も合わせて総合的に判断するので、「お久しぶりです」などの一般的な見出しを付けた巧妙な迷惑メールにもだまされません。

*形態素解析について詳しく知りたい方はこちら
学習型迷惑メールフィルターの設定画面
学習型迷惑メールフィルターの特長
学習を重ねるごとに判定精度がアップ
学習&排除の操作はかんたん。
メールを選んで、迷惑メールフォルダへドラッグ&ドロップするだけでOKです。
*従来のShurikenユーザーの方が、ツールバーのカスタマイズを行っている場合は、「→迷惑」「→非迷惑」ボタンは表示されません。[設定 - ツールボックス設定]で、これらをツールバーに表示させることができます。
2つのフィルターが迷惑メールを逃さない
迷惑メールフィルター ダブルディフェンス」を搭載。
学習初期でも、一般的な迷惑メールなら事前に学習済みのマスターフィルターが除去。マスターフィルターが取りこぼした新種の迷惑メールや判断の難しいメールも、ユーザーフィルターに学習させることで、どんどん精度が上がっていきます。
マスターフィルターに使う外部学習データは「Shuriken 2009」に搭載しますが、管理者やユーザーが作成することもできます。
パソコンに負荷をかけず、受信も高速
メモリに常駐するタイプのフィルターとは異なり、必要なときだけ動作するので、パソコンに負荷をかけず、受信も高速です。
ホワイトリスト(許可リスト)で、非迷惑メールの誤判定を防止
アドレス帳のデータを、ホワイトリストに利用することもできます。
ブラックリスト(禁止リスト)で、確実に迷惑メールを排除
特徴が少なく、迷惑メールとして判定されにくい迷惑メールも、ブラックリストを使えば、確実に排除できます
*差出人や見出しとの文字列比較により迷惑メールを判定する「基本フィルター」も搭載しています。ご利用の目的に合わせて、使用する迷惑メールフィルターを選択できます。
安心&快適のための機能を満載!
迷惑メール専用フォルダが便利!「ゴミ箱」に捨てたメールと区別できて安心
迷惑メールフォルダ内メールの自動削除も可能
「迷惑メールは着信報告を行わない」設定で、さらに快適に
学習データを複数PCで利用。インポート/エクスポート機能を搭載
空メールや外国語のメールを迷惑メールに指定可能
「Kaspersky Internet Security」のアンチスパム機能と連携
「Shuriken 2009」では、さらにここが機能アップ!<UP>
「ホワイトワード」で誤判定を防ぐ
基本フィルターに、学習型フィルターのホワイトリストとしても使用可能な「ホワイトワード」の機能を追加しました。任意の文字列をホワイトワードとして登録しておくことで、この文字列が含まれたメールは必ず「迷惑メールではない」と判定させることができます。
迷惑メールの中には、自分のメールアドレスを差出人(From)に偽装したものがありますが、これをブラックリストに登録してしまうと、自分が送ったメールがすべて迷惑メールと判定されてしまいます。そこで、自分の名前や友人同士で決めておいた符丁などを登録しておけば、それらが間違って迷惑メールと判断される心配がなくなります。

ブラックリストで判定した迷惑メールは既読に
学習型フィルターのブラックリストや基本フィルターによって迷惑メールと判定されたメールを「既読」にするオプションをご用意。これにより、「確認済み、または、確認しなくても間違いなく迷惑メール(既読メール)」と、「誤判定でないか念のため確認した方がよいメール(未読メール)」を区別できるようになりました。

迷惑メールフォルダのメールはハイパーリンクを表示しない
迷惑メールフォルダのメールについては、ビューアでURLやメールアドレスをハイパーリンクで表示しないようにしました。これにより、迷惑メールに含まれるURLをうっかりクリックして、フィッシング詐欺サイト等の危険なページにアクセスしてしまう被害を未然に防ぎます。
【形態素解析とは?】
形態素解析とは、文章を意味のある最小単位に分割し、文章に使われている語句の識別や品詞などを解析する技術です。
今回の「学習型迷惑メールフィルター」では、弊社独自の高度な形態素解析エンジンを組み込んで、迷惑メール判定や学習を行っており、以下のような特長を持ちます。
 
微妙に表記が異なる単語も、同一と見なすことができます。
例えば「バイオリン」と「ヴァイオリン」。
この2つが指しているものの意味は同じで、人はこの2つを同一視します。
しかし、表記が異なるためプログラムでは異なるものと扱われます。
今回の「学習型迷惑メールフィルター」では、単語の統制を掛けることにより、この2つをどちらも「バイオリン」としてプログラム内で扱うことができます。

この他にも名詞であれば、
 ・「ユーザー」 「ユーザ」 →「ユーザー」
 ・「慶応」 「慶應」    →「慶応」

動詞であれば語幹を見て、
  ・「動く」 「動かない」  →「動」

という風に同一視し、同じ表記に統制して使用するものがいくつもあります。

この処理により、表記を微妙に変化させた単語でも、統制後の単語がすでに迷惑メールとして学習されていれば、同じ単語として処理し、迷惑メールとして判定されます。
 
判定に用いる単語の品詞を限定することで、特徴を捉えやすくなります。
 ・「は」 「に」 「を」 「へ」等の助詞
 ・「ある」 「この」等の連体詞
 ・「さらには」 「かつ」等の接続詞
 ・サ変本体(「さ」 「し」 「す」 「する」 「すれ」 「せよ」)

これらのように、迷惑メール/非迷惑メールにかかわらず、日本語の文章ならどちらにも入っているような品詞は、迷惑メールの特徴としてとらえることはできません。

そこで、このように特徴として捉えることができない品詞は、今回の「学習型迷惑メールフィルター」では対象にしないようになっています。

たとえば、「本日は晴天なり。」ですと、
 
本日 晴天 なり
[名詞] [助詞] [名詞] [助動詞] [記号]
  となって、Shurikenでは「本日」「晴天」のみが判定に使用されます。

閉じる