不思議なのが、9月頃に最も多かったパターン(経営セミナーの案内)が、
数を減らして続いていることです。
添付されるJPEG画像(連絡先電話番号が記載されている)が
完全に同一なので、同一発信者だと思います。
全く無くなるのなら逆に解るのですが……
どうなってるんでしょうね?
戸田 孝@滋賀県立琵琶湖博物館
to...@lbm.go.jp
戸田 孝@滋賀県立琵琶湖博物館
to...@lbm.go.jp
Message-ID: <d1bmi2$l86$1...@bluegill.lbm.go.jp>
Date: Thu, 17 Mar 2005 10:35:46 +0000 (UTC)
Newsgroups: fj.comp.security,fj.mail
で報告しましたが、
先月(2007年6月)半ばから、また同じ現象が起っているようです。
そういえば、2007年10月には、ロシア語のSpamだけが急減少したことを
Message-ID: <djaj9f$10t$1...@bluegill.lbm.go.jp>
Newsgroups: fj.comp.security,fj.mail
Date: Fri, 21 Oct 2005 11:26:39 +0000 (UTC)
で報告しました。
いずれも、じわじわ増えて、いつのまにか元に戻ったんですが、
こういう現象って何が原因で起るんでしょうね?
戸田 孝@滋賀県立琵琶湖博物館
to...@lbm.go.jp
In article <0707181719...@takesima.lbm.go.jp>
to...@lbm.go.jp writes:
> 2005年頭に、他のSpamは全然減っていないのに
> EUC-KR(韓国語EUC)のSpamだけが激減したことを
> 先月(2007年6月)半ばから、また同じ現象が起っているようです。
私の所に届く spam では、そういう現象は観測できていません。
気になるのが、ベイズ・フィルタを通り抜けて来るやつ。それっぽ
い関係ないキーワードを含めているようにも見えるけど、深く見て
ないからわかりません。
> そういえば、2007年10月には、ロシア語のSpamだけが急減少したことを
> で報告しました。
> いずれも、じわじわ増えて、いつのまにか元に戻ったんですが、
> こういう現象って何が原因で起るんでしょうね?
1/f 揺らぎが出ているのでは。
\\ 新城 靖 (しんじょう やすし) \\
\\ 筑波大学 電子・情報 \\
Yasushi Shinjo wrote:
> > 2005年頭に、他のSpamは全然減っていないのに
> > EUC-KR(韓国語EUC)のSpamだけが激減したことを
> > 先月(2007年6月)半ばから、また同じ現象が起っているようです。
>
> 私の所に届く spam では、そういう現象は観測できていません。
去年、わたしが下記のような大味な集計をしたその後ですが、
> iij4u.or.jp経由で届いたspamが2000年1月くらいからの累計で
>
> 190,000 messagesくらい
> そのうち韓国業者から
> 58,000 messagesくらい
> 台湾、中共業者から
> 19,000 messags くらい
先月くらいの時点でまた集計してみたら
Gb2312 28533
Ja 14717
Kr 70653
その他(略)
合計 218202
割合としては、KS_C と EUC-KR 混合だとはいえ、韓国語メールは
増えているような。比較している期間が元記事と同一ではないので
参考程度になればと。
--
mailto:shi...@dd.iij4u.or.jp 渋谷伸浩
NGMCをやっているときに、
NGMCのML経由で来るSpamと直接来るSpamとで
傾向の差異があることに気付いていました。
例えば、直接到来するロシア語Spamは、
ほぼ全てWindows-1251だったのですが、
ML経由の分にはkoi8-rがかなり混ざっていました。
戸田 孝@滋賀県立琵琶湖博物館
to...@lbm.go.jp
In article <0707221431...@takesima.lbm.go.jp>
to...@lbm.go.jp writes:
> NGMCをやっているときに、
> NGMCのML経由で来るSpamと直接来るSpamとで
> 傾向の差異があることに気付いていました。
> 例えば、直接到来するロシア語Spamは、
> ほぼ全てWindows-1251だったのですが、
> ML経由の分にはkoi8-rがかなり混ざっていました。
たしかに、メーリング・リストのメールは少し違う感じは、します。
言語まで詳しく見てはいないけれど。
特に fj NGMC (News Group Management Committee) とか、パブリッ
クなものは、誰から来るかわからないので弾きにくいというのはあ
るのでしょう。選挙管理の時、英語のものは、spam かと思ってし
ばらくほっといたら、ある種の問い合わせで応答必要だったという
のがありました。
> 例えば、直接到来するロシア語Spamは、
> ほぼ全てWindows-1251だったのですが、
> ML経由の分にはkoi8-rがかなり混ざっていました。
最近、毎日数通 koi8-r のspam ube/uce が届くようになりました。
Windows-1251は最近さっぱりといっていいかも。
それと前後してドイツ語でED薬のspamが。
そして pdf 添付よりも zip 添付のspamが増加中。
…というのがわたしのメイルアドレスの定点観測状況。
--
mailto:shi...@dd.iij4u.or.jp 渋谷伸浩
戸田 孝@滋賀県立琵琶湖博物館
to...@lbm.go.jp
ヘッダと本文の不一致ならまだ良いのですが、
ヘッダ同志の不一致も多いんですよね。
多いのが、本文がkoi8-rで、Subject:もkoi8-rであることを宣言した
MIMEのヘッダ用文字列で実際にkoi8-rで記述されているのに、
From:にはWindows-1251が生で書いてあるというパターン。
もっと訳の解らないのが、
本文の途中でkoi8-rとWindows-1251が切り替わってしまうという例。
text/plainですよ。一体どういう編集工程でこういうものが出てくるんだろう?
冒頭の標題っぽいところとか、末尾の注意書きっぽいところとかだけ
違うコードになっている例が多いようなので、
別の文書から持ってきて貼りつける時に混ざるんでしょうかね。
でも、貼りつけの際に両方とも正常に読めてるの?
先日、ヒントになりそうな事例に行き当たりました。
text/htmlパートが、koi8-rの完結したHTMLソースの後に、
Windows-1251のプレーンテキストが続いた形になっていました。
ここから推測されるのは、編集者のデフォルトの編集コードはWindows-1251で、
HTMLソース部分には「koi8-rである」という情報が付いているために
正しくWindows-1251に変換した状態で見えているという可能性です。
こういう環境で編集したtext/htmlを
「text/plainじゃないとSpam対策に阻止され易い」と考えて
変換して出したのだと仮定すると、
その変換ソフトの出来が悪ければ起り得る話ですね。
コード指定を無視して、単純にHTMLタグを外してしまったと……
戸田 孝@滋賀県立琵琶湖博物館
to...@lbm.go.jp
今月(2007年9月)に入ってから何回も認識したのが、以下のパターン
・text/plainとtext/htmlのmultipart/alternative
・ヘッダも含めて全てが「koi8-r」であると宣言されている。
・ヘッダとtext/html部は実際にkoi8-rで記載されている。
・text/plain部はtext/html部と同じ内容がWindows-1251で記載されている。
どういう環境でこういう結果になるんでしょうね?
例えば、
>ここから推測されるのは、編集者のデフォルトの編集コードはWindows-1251で、
>HTMLソース部分には「koi8-rである」という情報が付いているために
>正しくWindows-1251に変換した状態で見えているという可能性です。
と同じ状況だと仮定すると、
text/plain部生成を受け持つ部分が編集者に見えているのと同じデータを
引っ張ってきているのに、その際のコード変換を無視した宣言をしている
ということが考えられます。
他にも色々な可能性がありそうですが、情報不足で確定はできませんね。
戸田 孝@滋賀県立琵琶湖博物館
to...@lbm.go.jp
何か理由があるんでしょうかね?
例えば、XpがVistaに置き替わったらkoi8-rが出る確率が高まる
何らかの理由があるとか?
戸田 孝@滋賀県立琵琶湖博物館
to...@lbm.go.jp