Google グループは Usenet の新規の投稿と購読のサポートを終了しました。過去のコンテンツは引き続き閲覧できます。
表示しない

spam with invalid tags

閲覧: 3 回
最初の未読メッセージにスキップ

to...@lbm.go.jp

未読、
2003/06/17 20:42:392003/06/17
To:
今年に入ってから、HTML形式で来るSPAMの中に
無意味なタグを大量に挟んだものを見掛けるようになりました。
例えば、偶々昨日来たのの一部は以下の通り。

Ga<kstwvb9k84b9q>inP<k2443gz38r5op>ro
P<kxnrlfb18baccf3>e<kg60duksozl>n<kucbtcdlp9hej2a>is
E<k9wwasv3k10w2c>nl<k3bmpsu3fb14>ar<kqjk8vp3v3ldy4>ge<kkople32168n>me<kin09sw1eah2>nt
P<kpm8dkrlrgeg1>il<kwemosi17mt5xd>l<kw3u0jy2n8ld>s
W<k4dbgo53irpw591>i<k0u2wbe3ykg3s>ll
E<k0bwv84313f>xp<k81rpv2zxxc>a<k8s7h3pfhpfc>nd,<br>
L<k9444ai11upaw4>en<kcj2nk1oofy66>gt<k5h3gue24u65i>he<kiltdhh3jxthxe3>n
A<k025stg2x201t2b>n<k1rstnd1wugc83h>d
E<kqo8vk13kpr>n<kw5dbbr3ic89t59>l<krnig7e2e4lkf>ar<khle7r429ecs>ge
Y<k5jzgkg5lhz1o1>ou<kppyjql1akrqo>r
P<ka7f4ks2l5ih163>en<kgcukwf1qx7zt8>i<kxzny2w3jb7>s 3<ko1xuy51804h1w>+
I<kwgb14w1cu09>nc<kwtdxq33njc3>he<komnwu327zjl>s<k24293g1kmdt6>!<br>

無意味なタグを除去して<br>だけ処理すると、
以下の文になります。

GainPro Penis Enlargement Pills Will Expand,
Lengthen And Enlarge Your Penis 3+ Inches!

#どーでも良いけど、英語圏からのSPAMって、
#どーして男性器巨大化の広告が多いんだろうね。
#韓国語や中国語では見掛けないぞ。

最近は全く意味を成さない文法違反のタグを使っているのが多いのですが、
出始めた初期には正当な「注釈」タグで、注釈の内容がナンセンス
というのが多かったようです。
つい最近には、無意味な文字列を「地」の部分に書いて
<comment>と</comment>で挟むというパターンも見掛けました。

こういうのって一体何を狙ってるんでしょうね?
内容解析して要らんのを除去するソフトの掏り抜けを狙ってるとか?
実効性あるんだろうか?

戸田 孝@滋賀県立琵琶湖博物館
to...@lbm.go.jp

Shinji KONO

未読、
2003/06/17 21:19:292003/06/17
To:
河野真治 @ 琉球大学情報工学です。

In article <bcochv$pon$1...@bluegill.lbm.go.jp>, to...@lbm.go.jp writes
> #どーでも良いけど、英語圏からのSPAMって、
> #どーして男性器巨大化の広告が多いんだろうね。
> #韓国語や中国語では見掛けないぞ。

はげが好まれるとか、そんな感じで、妙に直接的なみたいですね。

> こういうのって一体何を狙ってるんでしょうね?
> 内容解析して要らんのを除去するソフトの掏り抜けを狙ってるとか?

ってことなんでしょうねぇ。

> 実効性あるんだろうか?

ないでしょう。

こういうことになると、結局、利便性を制限してSPAM対策せざるを
得ないって感じですね。今でも、free mail 系は自動的に落してい
るので、たまに、「メール着きませんでしたか」とか言われる。

---
Shinji KONO @ Information Engineering, University of the Ryukyus,
PRESTO, Japan Science and Technology Corporation
河野真治 @ 琉球大学工学部情報工学科,
科学技術振興事業団さきがけ研究21(機能と構成)

to...@lbm.go.jp

未読、
2003/06/20 3:38:082003/06/20
To:
In article <3988483...@insigna.ie.u-ryukyu.ac.jp> ko...@ie.u-ryukyu.ac.jp writes:
>> こういうのって一体何を狙ってるんでしょうね?
>> 内容解析して要らんのを除去するソフトの掏り抜けを狙ってるとか?
>ってことなんでしょうねぇ。
>> 実効性あるんだろうか?
>ないでしょう。

ということで、とりあえず納得してたら、
fj.mail.systemで、

In article <YAS.03Ju...@kirk.is.tsukuba.ac.jp> (Subject: Re: MH pick with Bayes' Theorem) y...@is.tsukuba.ac.jp writes:
>> > * spamと、そうではない正当なメイル(このページではcleanと呼
>> > ぶ)を自動判別するフィルタ
>> > * 日本語に対応している
>> > * rubyで書かれている
>さらに続報です。どうもうまく弾けない spam があるかと思ったら、
>HTML で書かれていて、コメントで単語を分割していました。

という例が紹介されていました。
それなりの効果はあるようですね。

つい昨日、やたら無意味な文字列が書いてあるspamが来たので、
よく見てみたら、無意味な文字列の前後が
<font color="white">

</font>
で挟まれていました。
(私はHTMLメールはソースだけが見える環境になっています)

内容解析ツールの統計情報を混乱させようという魂胆のようです。

戸田 孝@滋賀県立琵琶湖博物館
to...@lbm.go.jp

新着メール 0 件