過去ログ表示


過去ログ 214 を表示

トピック内全 17 記事中の 1 〜 10 番目を表示
[ 最新記事及び返信フォームをトピックトップへ ]
このトピックの全ページ / [0] [1]

迷惑フィルターの学習機能
(#33952) このトピック中1番目の投稿
(環境: WinXP SP2/IE6)

Thunderbirid を使い始めてから、約4ヶ月になりますが、迷惑フィルターの学習機能は、どのくらい待てば「賢く」なれるのでしょうか?
今のところ、到着メールの90%が迷惑メールですが、迷惑メールの60%-70%くらいしか、除去されていない感じです。
正確な除去率が必要であれば数えてみますが、だいたいこんなものなのでしょうか?判定基準については触れておりません。

平行して使っているMACのMAILはほとんど100%に使い除去率なのです。

Re[1]: 迷惑フィルターの学習機能
(#33953) このトピック中2番目の投稿
(環境: その他/Mozilla1.7)

> 今のところ、到着メールの90%が迷惑メールですが、迷惑メールの60%-70%くらいしか、除去されていない感じです。

それぞれ「利用者側メールの受信間隔」「1回の受信で何通新しいメールが到着」するかで
BayesianFilterの挙動は変わります、一度に大量の判定不能メールは利用者に、どちらであるかの判断が委ねられる数も増えます =「不確定(すり抜けた)or未判定」も正しい動作です。

また、学習状態が間違った方向(利用者の嗜好)の場合は其れなりの結果にも成ります
40%のすり抜けと言うことでしたら
http://mx1.zive.net/Email_division.spam
↑ BayesianFilter状況評価の提供サイトでベイズ推量の判断値グラフを見られては如何でしょう
# IEでは評価アクセス出来ない様ですけど

Re[2]: 迷惑フィルターの学習機能
(#33955) このトピック中3番目の投稿
(環境: WinXP SP2/IE6/Thunderbird1.5)

Thunderbird を使い始めたばかりだけど、自分に届く spam は、ほとんど件名か差出人が文字化けしてるので
メッセージフィルタで件名か差出人が文字化けしてるのは迷惑メールフォルダに移動するようにしたら、
ほぼ100%に近い除去率(?)ですよ。

Re[1]: 迷惑フィルターの学習機能(Base64?)
(#33959) このトピック中4番目の投稿
(環境: Win2000/SeaMonkey1.5)

> Thunderbirid を使い始めてから、約4ヶ月になりますが、迷惑フィルターの学習機能は、どのくらい待てば「賢く」なれるのでしょうか?
> 今のところ、到着メールの90%が迷惑メールですが、迷惑メールの60%-70%くらいしか、除去されていない感じです。

> 平行して使っているMACのMAILはほとんど100%に使い除去率なのです。

ベイズフィルターで判定されなかったものは、こまめにきちんと手動でジャンクにしている、
迷惑メールと判定されない30%〜40%のメールの数は毎日数個〜10数個程度で、数百・数千というようなオーダーではない、
という前提で...

最近のスパムには、一部のメーラーがベイズフィルターに渡すときにBase64だとデコードしないで渡しているようだ、というのを知ってか知らずか、
メールのサブジェクトはジャンク送りになりにくいものにしておき、メール本文をBase64エンコードして送ってくるものがあります。
(中身は、文字の間に「*」などを入れる、だけでなく、「縦読み」の手法を併用したりしていて、なかなか楽しい... (^^)
スパムしか来ない(一日60件程度)アカウントがあるのですが、
# 以前、愚かにも懸賞サイトなどでも使ったもので、今は使用しないようにして様子見中のもの。
# さっさとアドレス変更しちゃえばいいんですけど、そうすると日本の業者からの楽しいスパムが見れなくなるので、まだ様子見を継続中...(^^;
そのうちの数件はBase64で送ってくるので、表示される文面だとほぼ確実にジャンク送りになるようなものでも、それらは自動的にジャンク送りになってくれていません。

MACのMAILだとうまくいっているようですし、Base64で送ってくるスパムの場合じゃないですか?

Re[3]: 迷惑フィルターの学習機能
(#33979) このトピック中5番目の投稿
(環境: WinXP SP2/Firefox1.5/Thunderbird1.5)

たまさん
こんばんは。

> メッセージフィルタで件名か差出人が文字化けしてるのは迷惑メールフォルダに移動するようにしたら、
> ほぼ100%に近い除去率(?)ですよ。

正常でないメールって様々なパターンがありすぎてルールを一つか二つにして取り除く事は至難の業ですが、どういうルールを作っているのか参考までに教えて下さい。

Re[4]: 迷惑フィルターの学習機能
(#33980) このトピック中6番目の投稿
(環境: WinXP SP2/IE6/Thunderbird1.5)

VMAXさん
こんばんわ、あっもう朝だ、おはようごさいます。

> 正常でないメールって様々なパターンがありすぎてルールを一つか二つにして取り除く事は至難の業ですが、どういうルールを作っているのか参考までに教えて下さい。

私に届く文字化け spam を、調べてみたら
1. MIME ヘッダで文字コードを偽っている(JIS といってるけど実際は SJIS)
2. MIME エンコードしないで、SJIS のまま
とゆー2パターンでした。
文字化けするとき、黒塗りのひし形の中にはてなが白抜きになった文字が表示されるでしょ。
以下この字をはてびしと呼びます。
条件は 件名に、はてびしを含む または 差出人に、はてびしを含む としたらOKでした。
はてびしはマウスでコピペして入力できました。
この条件で Spamcop や迷惑メール相談センターに転送してしまうことも可能です。
ただし Spamcop が管理者に送る苦情メールのコピーを自分にも送るように設定している場合、
このコピーメールは転送されないようにしなければなりません。
フィルタをすり抜けようとして、わざわざ変な送り方をしてるんだろうけど、
それがあだになって確実にスパムと判定されるのを見ると愉快ですね。

Re[5]: 迷惑フィルターの学習機能 (はてびし)
(#33984) このトピック中7番目の投稿
(環境: Win2000/SeaMonkey1.5)

> 文字化けするとき、黒塗りのひし形の中にはてなが白抜きになった文字が表示されるでしょ。
> 以下この字をはてびしと呼びます。
> 条件は 件名に、はてびしを含む または 差出人に、はてびしを含む としたらOKでした。
> はてびしはマウスでコピペして入力できました。

目から鱗...

スパムお得意のメチャクチャなヘッダーデータが、比較が行われる時点で、表示されているのと同様にユニコードのU+FFFDに変換されている、ということまでは、思い至りませんでした。
デコードしたヘッダーのデータをユニコードに変換してから、フィルターに指定されている文字列(UTF-8で保管している)と比較しているんですね。
ヘッダーをデコードしたあとの検索では、フィルターに指定されている文字列をヘッダーの文字コードに変換してから比較、と思い込んでました(^^;

これで、Base64で送ってくるものでも、半分くらいはフィルターでひっかけられそうです。

なお、「はてびし」のユニコードの名前は、REPLACEMENT CHARACTER。
http://www.fileformat.info/info/unicode/char/fffd/index.htm
でも、「はてびし」のほうが、圧倒的にわかりやすい(^^)

Re[5]: 「はてびし」がありません。
(#34000) このトピック中8番目の投稿
(環境: WinXP SP2/SeaMonkey1.0)

たまさん
こんばんは。

> 文字化けするとき、黒塗りのひし形の中にはてなが白抜きになった文字が表示されるでしょ。

件名や本文に半角の「?」はありますが、「はてびし」はありません。
受信も送信も ISO-2022-JPにしているのがいけないのでしょうか?
それともフォントの問題でしょうか?
Thunderbird すべての受信メッセージに規定の文字エンコーディングを使用する。にチェックを入れています。

フォントは上から順に
ゴシック体
MSP明朝
MSPゴシック
MSゴシック
です。

私の所に来るspamは from: 変な文字 <example@mozilla.co.jp>
というのが多いです。
エンコード?の =?ほにゃらら?=でも、通常のテキストでもありません。
Thunderbirdの画面上では ?????????????????????というのが多いです。

Re[6]: 「はてびし」がありません。
(#34001) このトピック中9番目の投稿
(環境: その他/Mozilla1.7)

>>文字化けするとき、黒塗りのひし形の中にはてなが白抜きになった文字が表示されるでしょ。
>
> 件名や本文に半角の「?」はありますが、「はてびし」はありません。

前に示した所の左
http://mx1.zive.net/down.load/msgFilterRules.dat.example
の中に設定のサンプルがあります。
サンプルルールの中からコピーは可能と思います。

オクタルで「\357\277\275」、16進「0xEF 0xBF 0xBD」の事で機種依存ですから
見え方は色々なんです。

Re[2]: 迷惑フィルターの学習機能(Base64?)
(#34008) このトピック中10番目の投稿
(環境: WinXP SP2/IE6)

スレッド元を書いた本人です。
多くのコメントをつけていただき、喜んでおります。
が......、どうも内容が難しすぎて私には良くわからないのが残念です。

でも、このまま様子を見ているしかない(らしい)ということは理解できました。今のところ、フィルターにかからない迷惑メールは、腹を立てながら、その都度手動で迷惑マールのしるしをつけて、除去しております。
このままだと、いずれ電子メールというものは、実用にならなくなるんじゃないでしょうかね。そんな気がしております。

ありがとうございました。
済!

[ 次のトピック内容10件 ]
このトピックの全ページ / [0] [1]

返信不可


- Child Tree -