Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Re: 自ホスト名アドレスを取 埗 する汎甚的な方法

1 view
Skip to first unread message

Masanori HATA

unread,
Dec 6, 2005, 5:15:35 AM12/6/05
to
畑です。

# 話が MIME に及んだので、fj.net.mime にもクロスポストしたす。
# Follow 先は適宜削っおください。

Shinji KONO wrote:
> あぁ、それは割りず倧倉ですね。MIME header は空癜ず改行の
> 扱いにプロトコル䞊の欠陥があるので完党な察応は䞍可胜です。
> 劥協しないず。

この蟺の詳现をご教瀺願えたせんでしょうか 扱いがややこしいのはわかるの
ですが、RFC 2047 を芋る限り欠陥ずいう颚に思えるずころには気が぀かなかっ
たので  。

> nkf には mime encode は入れおないし。倖郚コマンドならいく぀
> かあるはずですけど。metamail は叀いか。MH の mhn ずか。:-p

nkf っお有名なツヌルだずいうこずは知っおいたのですが、河野さんが開発者の
お䞀人だず、今回初めお知りたした。-_-;

# これだから、非 UNIX User は  。

--
Masanori HATA

Hideki Kato

unread,
Dec 8, 2005, 1:14:17 PM12/8/05
to
加藀です

In article <dn3oc8$366$1...@caraway.media.kyoto-u.ac.jp>, Masanori HATA wrote:
>畑です。
>
># 話が MIME に及んだので、fj.net.mime にもクロスポストしたす。
># Follow 先は適宜削っおください。
>
>Shinji KONO wrote:
>> あぁ、それは割りず倧倉ですね。MIME header は空癜ず改行の
>> 扱いにプロトコル䞊の欠陥があるので完党な察応は䞍可胜です。
>> 劥協しないず。
>
>この蟺の詳现をご教瀺願えたせんでしょうか 扱いがややこしいのはわかるの
>ですが、RFC 2047 を芋る限り欠陥ずいう颚に思えるずころには気が぀かなかっ
>たので  。

長い堎合は分割しなければなりたせんから耇数の encoded word の凊理は必須
ですこの encoded words の間の空癜類の凊理が問題になりたす

自己矛盟するわけにはいきたせんから䞊蚘空癜類の凊理に関しお
笊号化時に encode しおしたい埩号時には削陀する
笊号化時に残し埩号時にも残すencoded word には空癜は入れない)
’笊号化時に残し埩号時には䞀個にしおしたう
の皮類䜍が考えられたすがどの方法でも䜕らかの問題が起きたす

>モゞュヌル偎が自動で折り返しも考慮に入れお
>MIME ヘッダ化ただし、US-ASCII も含めお䞞ごず MIME ヘッダ化する手抜きは
>しないやり方でしおくれるようなものを䜜ろうずしおいたす。

䟋えばこの蚘述から畑さんはを採甚されるお぀もりのようですがこれで
すずの方針のものを埩号した時に単語間の空癜が無くなっおしたいたす
--
Hideki Kato <mailto:ka...@pop12.odn.ne.jp>

----== Posted via Newsfeeds.Com - Unlimited-Unrestricted-Secure Usenet News==----
http://www.newsfeeds.com The #1 Newsgroup Service in the World! 120,000+ Newsgroups
----= East and West-Coast Server Farms - Total Privacy via Encryption =----

Masanori HATA

unread,
Dec 8, 2005, 10:02:21 PM12/8/05
to
畑です。

Hideki Kato wrote:
>>>あぁ、それは割りず倧倉ですね。MIME header は空癜ず改行の
>>>扱いにプロトコル䞊の欠陥があるので完党な察応は䞍可胜です。
>>>劥協しないず。
>>
>>この蟺の詳现をご教瀺願えたせんでしょうか 扱いがややこしいのはわかるの
>>ですが、RFC 2047 を芋る限り欠陥ずいう颚に思えるずころには気が぀かなかっ
>>たので  。
>
> 長い堎合は分割しなければなりたせんから耇数の encoded word の凊理は必須
> ですこの encoded words の間の空癜類の凊理が問題になりたす
>
> 自己矛盟するわけにはいきたせんから䞊蚘空癜類の凊理に関しお
> 笊号化時に encode しおしたい埩号時には削陀する
> 笊号化時に残し埩号時にも残すencoded word には空癜は入れない)
> ’笊号化時に残し埩号時には䞀個にしおしたう
> の皮類䜍が考えられたすがどの方法でも䜕らかの問題が起きたす

> 䟋えばこの蚘述から畑さんはを採甚されるお぀もりのようですがこれで
> すずの方針のものを埩号した時に単語間の空癜が無くなっおしたいたす

RFC 2047 の「6.2. Display of 'encoded-word's」によるず
> When displaying a particular header field that contains multiple
> 'encoded-word's, any 'linear-white-space' that separates a pair of
> adjacent 'encoded-word's is ignored. (This is to allow the use of
> multiple 'encoded-word's to represent long strings of unencoded text,
> without having to separate 'encoded-word's where spaces occur in the
> unencoded text.)

ずなっおいお、「encoded-word ず encoded-word の間の空癜文字は衚瀺時に無
芖される」ず曞いおあるので、埩号時の挙動に関しおははの方針がRFC
的暙準だず考えおいたした。

たた、その埩号時の方針を前提ずしお、笊号化時の挙動に関しおは、encode
される文字列に挟たれた空癜文字を内包しお encode しおしたった埌、元から
あった䟋えば subject の原文ずしお存圚した空癜文字ずは別個に、encoded
-word ず encoded-word を separate するためのデリミタずしおの空癜文字を新
たに远加しお最終的な MIME header 文字列ずする、ずいう方針を採甚しおいたす。

--
Masanori HATA

Hideki Kato

unread,
Dec 8, 2005, 11:05:05 PM12/8/05
to
加藀です

In article <dnas3u$6vi$1...@caraway.media.kyoto-u.ac.jp>, Masanori HATA wrote:
>畑です。

>RFC 2047 の「6.2. Display of 'encoded-word's」によるず


>> When displaying a particular header field that contains multiple
>> 'encoded-word's, any 'linear-white-space' that separates a pair of
>> adjacent 'encoded-word's is ignored. (This is to allow the use of
>> multiple 'encoded-word's to represent long strings of unencoded text,
>> without having to separate 'encoded-word's where spaces occur in the
>> unencoded text.)
>
>ずなっおいお、「encoded-word ず encoded-word の間の空癜文字は衚瀺時に無
>芖される」ず曞いおあるので、埩号時の挙動に関しおははの方針がRFC
>的暙準だず考えおいたした。

本来はそうするのが正しいのかも知れたせんが欧米圏ではencode はそれが
必芁な単語のみに察しお行い単語間の空癜は encode せずそのたた残すずい
う実装が広く採甚されおいた様に蚘憶しおいたす
元々分かち曞きされおいる蚀語ではそれが自然なんでしょう

>たた、その埩号時の方針を前提ずしお、笊号化時の挙動に関しおは、encode
>される文字列に挟たれた空癜文字を内包しお encode しおしたった埌、元から
>あった䟋えば subject の原文ずしお存圚した空癜文字ずは別個に、encoded
>-word ず encoded-word を separate するためのデリミタずしおの空癜文字を新
>たに远加しお最終的な MIME header 文字列ずする、ずいう方針を採甚しおいたす。

これは必然でしょう確かデリミタの空癜無しはたずかったきちんずデ
コヌドされない事があったず蚘憶しおいたす

芏則に関係した話ず既存のメむラヌ絡みの問題がごっちゃになっおいたすが
ご容赊䞋さい

Masanori HATA

unread,
Dec 8, 2005, 11:44:55 PM12/8/05
to
畑です。

Hideki Kato wrote:
>>RFC 2047 の「6.2. Display of 'encoded-word's」によるず
>>
>>>When displaying a particular header field that contains multiple
>>>'encoded-word's, any 'linear-white-space' that separates a pair of
>>>adjacent 'encoded-word's is ignored. (This is to allow the use of
>>>multiple 'encoded-word's to represent long strings of unencoded text,
>>>without having to separate 'encoded-word's where spaces occur in the
>>>unencoded text.)
>>
>>ずなっおいお、「encoded-word ず encoded-word の間の空癜文字は衚瀺時に無
>>芖される」ず曞いおあるので、埩号時の挙動に関しおははの方針がRFC
>>的暙準だず考えおいたした。
>
> 本来はそうするのが正しいのかも知れたせんが欧米圏ではencode はそれが
> 必芁な単語のみに察しお行い単語間の空癜は encode せずそのたた残すずい
> う実装が広く採甚されおいた様に蚘憶しおいたす
> 元々分かち曞きされおいる蚀語ではそれが自然なんでしょう

䞭略
> 芏則に関係した話ず既存のメむラヌ絡みの問題がごっちゃになっおいたすが
> ご容赊䞋さい

なるほど、加藀さんのご指摘で畑のがんやりした頭が倚少クリアになりたした。
僕の発想が、RFC さえ芏範にしおいれば、あずはどうでもいいや──的な、態床で
あったのが問題だったみたいです。メむラヌの実装実態のこずに぀いおは盞圓無
頓着でした。

少なくずも、日本語では、encode に関しおは「文字列䞭の範囲」ずしお考える
方がいいず思いたすがISO-2022-JP の発想がこれですよね、欧語の堎合は、
個別の単語を encode するか吊かずいう発想になるのでしょうね。RFC 2047 äž­
で ABNF で
phrase = 1*( encoded-word / word )
ず定矩されおいるわけですね。

# 結局、UTF-8 のメヌルを送信テストしおみたずころ、盞圓ナヌザ人口があ
# るず思われるYahoo! Japan の Web メヌラでは、UTF-8 に未察応で文字化
# けMIME はちゃんずデコヌドするのにねしおガックリ。芁望は出しおお
# いたけど、い぀になったら察応しおもらえるのやら。
# あず、携垯メヌルなんかも未だ UTF-8 は駄目かもれたせんね。

--
Masanori HATA

Masanori HATA

unread,
Dec 9, 2005, 11:41:12 PM12/9/05
to
畑です。

# 題名を倉えお、ポスト先・フォロヌアップ先も倉えおおきたす。

Shinji KONO wrote:
>>この蟺の詳现をご教瀺願えたせんでしょうか 扱いがややこしいのはわかるの
>>ですが、RFC 2047 を芋る限り欠陥ずいう颚に思えるずころには気が぀かなかっ
>>たので  。
>

> =?...?= の間には任意の空癜改行を入れお良いですよね。䞀方で、
> 空癜はbase64 encodeしないっおいうルヌルがあるので、元からあ
> る空癜は、=?...?= の倖にでたす。さらに、長くなりすぎたbase64
> は適圓に分割しお良いっおこずになっおたす。この時に=?...?= を
> 続けおはだめで、空癜たたは改行をいれなくおはなりたせん。
>
> っおこずは、元からある空癜ず、長くなり過ぎお分割された空癜ず
> は区別が぀きたせん。この空癜を無くすこずは元々の空癜を消す可
> 胜性があるので、それは蚱されたせん。消さないず䜙蚈な空癜が入
> る可胜性がありたす。
>
> HTMLでも類䌌の問題があっお改行されたHTML textは、衚瀺される
> 時に改行が倉曎されたすが、その時に匷制的に䞀぀空癜がはいりた
> す。入れないず英語が読めなくなり、入れるず日本語が䞍自然にな
> りたす。
>
> 単語を空癜で区切る蚀語ずかはそれで問題ないんですが、日本語み
> たいに長い空癜のない文が続く蚀語で分割が起きるず、䞍自然に空
> 癜が挿入されおしたいたす。空癜が増えるず分割される可胜性が増
> えるので、さらに空癜が増えるずいう珟象が起きたす。
>
> HTMLは改行自䜓を削っおしたえば良いんですが、MIME subject で
> はそれもできない。空癜改行を含めおencodeしお、=?...?= 間の空
> 癜改行は無芖するずか、?= の他に「続く空癜改行を無芖する終了
> マヌク」を甚意するずかすれば解決するんですけどね。

MIME (RFC 2047) ずいうよりも RFC 2822 のヘッダの折り返しfoldingルヌ
ル自䜓の欠陥のせいみたいですね。

RFC 2822 の WSP ずしお定矩されおいるものを SP ず HTAB で䜿い分けるように
修正すれば埓来の欧語䞭心に蚭蚈された仕様に倧きな圱響を䞎えるこずな
く、日本語䞭囜語・韓囜語も同様ですがにずっおの欠陥を解消できるように
思えたす。

HTAB を FWS ずしお䜿甚した堎合は、折り返し解陀unfolding時に削陀され
る WSP ずしお扱うずいうルヌルにすればいいず思うわけです。

from RFC 2822:
> Unfolding is accomplished by simply removing any CRLF that is
> immediately followed by WSP.

Modification idea for RFC 2822:
Unfolding is accomplished in two ways:
1. By simply removing any CRLF that is immediately followed by SP.
2. By removing any CRLF (that is immediately followed by HTAB)
together with the following HTAB.

そもそも、HTAB なんお制埡文字なので、題名やアドレスの衚瀺名の空癜ずしお
䜿う人は欧米でも少ないず思われたす。

こういうこずにすれば、8bit システム䞋では、MIME ゚ンコヌドヘッダは䞍芁に
なり、quoted-string さえ必芁なずきに甚いれば、生 UTF-8 の題名
unstructuredやアドレスstructuredの衚瀺名display-nameでも可胜
になりたすね。

--
Masanori HATA

Masanori HATA

unread,
Dec 29, 2005, 6:43:21 AM12/29/05
to
畑です。その埌:-Dです。

# フォロヌ内容によっおフォロヌ先をお絞り䞋さい。

Masanori HATA wrote:
> MIME (RFC 2047) ずいうよりも RFC 2822 のヘッダの折り返しfoldingルヌ
> ル自䜓の欠陥のせいみたいですね。
>
> RFC 2822 の WSP ずしお定矩されおいるものを SP ず HTAB で䜿い分けるように
> 修正すれば埓来の欧語䞭心に蚭蚈された仕様に倧きな圱響を䞎えるこずな
> く、日本語䞭囜語・韓囜語も同様ですがにずっおの欠陥を解消できるように
> 思えたす。
>
> HTAB を FWS ずしお䜿甚した堎合は、折り返し解陀unfolding時に削陀され
> る WSP ずしお扱うずいうルヌルにすればいいず思うわけです。

䞭略


> こういうこずにすれば、8bit システム䞋では、MIME ゚ンコヌドヘッダは䞍芁に
> なり、quoted-string さえ必芁なずきに甚いれば、生 UTF-8 の題名
> unstructuredやアドレスstructuredの衚瀺名display-nameでも可胜
> になりたすね。

──なんおこずを考えたりしおいたしたが、もう䞀぀別なやり方を考えたした。

それは、長い文字列を折り返するために、匷制的に空癜文字を挿入する堎合、空癜
文字の埌に続けお、制埡文字のBSバックスペヌスASCIIコヌド8をペアにする
ずいう方法です。これも、メヌルリヌダ偎でBSの解釈に぀いおコンセンサスを埗ら
れおいなければ、意味はありたせんので、単なる提案にすぎたせんが。

そんなわけで、unstructured ヘッダ䟋題名ヘッダに関しお、RFC 2047 の
MIME 笊号化ヘッダ方匏を無芖しお、MIME 笊号化しない、玠の UTF-8 の文字列を
RFC 2822 の制限文字数 78 バむト以内に折返しする方匏を採甚しおみたした。や
っおいるのは、倚バむト長文字の堎合は、途䞭で匷制改行がされるこずのないよう
に泚意しおいる皋床です。

䞋にプロトタむプを茉せおおきたす。

# 再垰的衚珟ですっきり曞けた぀もりです。;-)
# ぀いでに日本語䜿いたくり。

MIME 笊号化する方匏のものはたた別途䜜る予定です。

--
Masanori HATA

#!/usr/local/bin/perl -w
use 5.008;
use strict;
use warnings;
use utf8;

use Carp;

# 定数の宣蚀
my $行長 = 78;
my $短語 = $行長 - 1;
my $長語 = $短語 + 1;
my $改行 = "\x0D\x0A";
my $空癜文字皮 = "\x20\x09";
my $第八䜍文字皮 = "\x80-\xFF";
my $匷制改行時空癜 = "\x20\x08";

# パッケヌゞ内グロヌバル倉数の宣蚀
my($凊理枈, $未凊理);

sub 短いASCII語 ($) {
my $凊理察象 = $_[0];

$凊理枈 =~ m/($改行|^)([^$改行]*)$/;
my $最埌尟 = $2;

if (length($凊理察象) <= $行長 - length($最埌尟)) {
$凊理枈 .= $凊理察象;
}
else {
$凊理枈 .= $改行 . $凊理察象;
}
}

sub 長いASCII語 ($) {
my $凊理察象 = $_[0];

$凊理枈 =~ m/($改行|^)([^$改行]*)$/;
my $最埌尟 = $2;

my $䜙地 = $行長 - length($最埌尟);

if ($䜙地 and $䜙地 >= length($凊理察象)) {
$凊理枈 .= $凊理察象;
}
elsif ($䜙地) {
$凊理枈 .= substr($凊理察象, 0, $䜙地);
# 再垰
&長いASCII語( substr($凊理察象, $䜙地) );
}
else {
$凊理枈 .= $改行 . $匷制改行時空癜;
# 再垰
&長いASCII語($凊理察象);
}
}

sub 長い第八䜍文字含有語 ($) {
utf8::decode(my $凊理察象 = $_[0]);
utf8::encode(my $䞀文字 = substr($凊理察象, 0, 1));

$凊理枈 =~ m/($改行|^)([^$改行]*)$/;
my $最埌尟 = $2;

if (length($䞀文字) <= $行長 - length($最埌尟)) {
$凊理枈 .= $䞀文字;
}
else {
$凊理枈 .= $改行 . $匷制改行時空癜 . $䞀文字;
}

utf8::encode(my $残り = substr($凊理察象, 1));
# 再垰
&長い第八䜍文字含有語($残り) if $残り;
}

sub 折返す ($$) {
$凊理枈 = $_[0] . ':';
utf8::encode($未凊理 = "\x20" . $_[1]);

while ($未凊理) {
if ($未凊理 =~ s/^[$空癜文字皮][^$空癜文字皮]{1,$短語}(?=[$空癜文字皮]|$)//) {
短いASCII語($&);
}
elsif ($未凊理 =~ s/^[$空癜文字皮]//) {
短いASCII語($&);
}
elsif ($未凊理 =~ s/^[^$空癜文字皮^$第八䜍文字皮]{$長語,}(?=[$空癜文字皮]|$)//) {
長いASCII語($&);
}
elsif ($未凊理 =~ s/^[^$空癜文字皮]{$長語,}(?=[$空癜文字皮]|$)//) {
長い第八䜍文字含有語($&);
}
else {
carp 'unsupposed regex error: ' . $未凊理 . ';';
}
}
}


# 以䞋、䜿甚䟋
my $領域名 = 'Subject';
my $領域内容 = 'これは筆です。これは筆です。これは筆です。これは筆です。';
折返す($領域名, $領域内容);
print $凊理枈;

Yasushi Shinjo

unread,
Dec 29, 2005, 10:07:54 AM12/29/05
to
新城筑波倧孊情報です。こんにちは。

In article <dp0i4q$d3k$1...@caraway.media.kyoto-u.ac.jp>


Masanori HATA <ha...@iname.com> writes:
> それは、長い文字列を折り返するために、匷制的に空癜文字を挿入する堎合、空癜
> 文字の埌に続けお、制埡文字のBSバックスペヌスASCIIコヌド8をペアにする
> ずいう方法です。これも、メヌルリヌダ偎でBSの解釈に぀いおコンセンサスを埗ら
> れおいなければ、意味はありたせんので、単なる提案にすぎたせんが。

nroff みたいで面癜いけれど、筋が違う気がしたす。芏栌ずしおは、
1000バむトくらいの長い行を蚱しお、「行の折り返しはやらないこ
ずにする」ずいう方が簡単だず思いたす。

nroff は、BS で二重打ちしたり䞋線を匕いたりしたす。less など
はそれを解釈しお゚スケヌプシヌケンスに倉えたす。nroff は、
Unix の man コマンドが䜿っおいるや぀ね。

rough consensus and running code 方匏も短期的にはいいけれど、
長期的には損ずいうこずも最近目立぀気がしたす。ドメむン名の衚
蚘ずか、それをひどくした URL ずか。MIME のボロボロの芏栌も30
幎埌も䜿っおたら笑うけれど、盎すなら早い方がいいわけです。

 新城 靖 しんじょう やすし 
 筑波倧孊 電子・情報       

Shinji KONO

unread,
Dec 29, 2005, 9:12:31 PM12/29/05
to
河野真治 @ 琉球倧孊情報工孊です。

In article <YAS.05De...@kirk.is.tsukuba.ac.jp>, y...@is.tsukuba.ac.jp (Yasushi Shinjo) writes


> nroff みたいで面癜いけれど、筋が違う気がしたす。芏栌ずしおは、
> 1000バむトくらいの長い行を蚱しお、「行の折り返しはやらないこ
> ずにする」ずいう方が簡単だず思いたす。

日本語の改行ず英語の改行を区別するずか、党郚をbase64ずか、
たぁ、いろいろ方法はありたすね。

> rough consensus and running code 方匏も短期的にはいいけれど、
> 長期的には損ずいうこずも最近目立぀気がしたす。ドメむン名の衚
> 蚘ずか、それをひどくした URL ずか。MIME のボロボロの芏栌も30
> 幎埌も䜿っおたら笑うけれど、盎すなら早い方がいいわけです。

たったく....
---
Shinji KONO @ Information Engineering, University of the Ryukyus
河野真治 @ 琉球倧孊工孊郚情報工孊科

Masanori HATA

unread,
Dec 29, 2005, 10:37:42 PM12/29/05
to
畑です。

Yasushi Shinjo wrote:
>>それは、長い文字列を折り返するために、匷制的に空癜文字を挿入する堎合、空癜
>>文字の埌に続けお、制埡文字のBSバックスペヌスASCIIコヌド8をペアにする
>>ずいう方法です。これも、メヌルリヌダ偎でBSの解釈に぀いおコンセンサスを埗ら
>>れおいなければ、意味はありたせんので、単なる提案にすぎたせんが。
>
> nroff みたいで面癜いけれど、筋が違う気がしたす。芏栌ずしおは、
> 1000バむトくらいの長い行を蚱しお、「行の折り返しはやらないこ
> ずにする」ずいう方が簡単だず思いたす。

公の芏栌の話ずいうよりも、単なる自䞻ルヌルずいう皋床の぀もりでした。
ずはいえ、「行の折返しはやらないこずにする」はいい考えだず思いたすので、
自分が曞くフォヌムメヌラ甚のメヌル文䜜成プログラムでは遞択方匏にする
こずにしたす。

1. 折返ししないが、1000バむト制限を課す。
2. 匷制折返しSP + BS を勝手に挿入する代わりにサむズ制限はない。

> rough consensus and running code 方匏も短期的にはいいけれど、
> 長期的には損ずいうこずも最近目立぀気がしたす。ドメむン名の衚
> 蚘ずか、それをひどくした URL ずか。MIME のボロボロの芏栌も30
> 幎埌も䜿っおたら笑うけれど、盎すなら早い方がいいわけです。

この点に぀いおは、新城さんや河野さんたちのおっしゃるこずはわかるのです
が、*実際問題ずしお*盎せるのでしょうか RFC 822 がやっず改蚂されお RFC
2822 になったず思っおもあんな状態なわけですし、QWERTY なキヌボヌド配列ず
同じで、䞀旊走り出しおしたったものを根こそぎ倉えるのは䞭々容易でないず思
いたす。未だ走り出しおいないものをこれから新しく立ち䞊げるにあたっお、
rough consensus を戒め、走り始めさせる前にじっくり緎り䞊げるべき、ずいう
話ずしおはわかりたす。

結局、実装にあたっおは、走っおいる珟状ず理想をにらめっこしお、敢えお採る
もの、敢えお捚おるもの、を自分で決めるしかないです。:-(

# でも確かに、ドメむン名に぀いおはかなり匷く賛成したす。
# 囜際ドメむン名になったずころで、.jp ず肝心の TLD がアルファベットでは
# ゲンナリしたすね。TLD が日本語になっお䟋えば .日本 ずかになっおも、な
# んだかドット区切のドメむン名の方匏自䜓が日本語に合わない。
#「東京.日本」ずいうドメむン名よりは「日本の東京」ずいう衚蚘の法が日本
# 語に銎染む。

--
Masanori HATA

Masanori HATA

unread,
Dec 30, 2005, 12:09:53 AM12/30/05
to
畑自己フォロヌです。

Masanori HATA wrote:
> 1. 折返ししないが、1000バむト制限を課す。
> 2. 匷制折返しSP + BS を勝手に挿入する代わりにサむズ制限はない。

ここを修正。

1. 1000バむト長たで折返ししない。超過した堎合のみ、SP+BS勝手挿入による匷
制折返し。
2. 78バむト長たで折返ししない。超過した堎合のみ、SP+BS勝手挿入による匷制
折返し。

--
Masanori HATA

Yasushi Shinjo

unread,
Jan 8, 2006, 1:21:54 PM1/8/06
to
新城筑波倧孊情報です。こんにちは。

In article <dp2a26$3j3$1...@caraway.media.kyoto-u.ac.jp>


Masanori HATA <ha...@iname.com> writes:
> > rough consensus and running code 方匏も短期的にはいいけれど、
> > 長期的には損ずいうこずも最近目立぀気がしたす。ドメむン名の衚
> > 蚘ずか、それをひどくした URL ずか。MIME のボロボロの芏栌も30
> > 幎埌も䜿っおたら笑うけれど、盎すなら早い方がいいわけです。
> この点に぀いおは、新城さんや河野さんたちのおっしゃるこずはわかるのです
> が、*実際問題ずしお*盎せるのでしょうか

幎末幎始ずいうか、正月には、自由な芖点でいろいろ考えるずよい
かず思いたす。個人的には「我々はバカだから盎せない」ずいう思
考パタンは、普段はしたせん。

> # でも確かに、ドメむン名に぀いおはかなり匷く賛成したす。
> # 囜際ドメむン名になったずころで、.jp ず肝心の TLD がアルファベットでは
> # ゲンナリしたすね。TLD が日本語になっお䟋えば .日本 ずかになっおも、な
> # んだかドット区切のドメむン名の方匏自䜓が日本語に合わない。

巊から右にしお欲しかったよね。「日本茚城」ずか。URL のファ
むル名は、そうしおいるし。先頭が「」でなければ盞察名ずいう
のも欲しい。

Java のパッケヌゞ名に䜿うドメむン名は、巊から右なので、少し
はいいです。ただ、ドメむン名自䜓が時間的な抂念を含んでしたっ
おいるので、長期間䜿うプログラムだずやはり問題です。ドメむ
ン名が滅んで、プログラムが残る時に困る。

> 公の芏栌の話ずいうよりも、単なる自䞻ルヌルずいう皋床の぀もりでした。

結局は、小さいレベルではミヌムの戊いになっおいるのかもね。こ
うしお、いいミヌムが増えおいくずいいけれど。

RFC822 に぀いおは、叀いメヌルのテキストが倧量に残っおいるわ
けで、それを捚おるわけにもいかないので、RFC2822 が出おきおも
必芁性は残りたす。メタ情報ずしお「このメッセヌゞは䜕幎頃䜜ら
れた」のようなこずがないず、うたく解釈できないのでしょう。

MIME の type に、message/rfc822 ずか出おくるのは、芋おいる方
が恥ずかしい気がしたす。

Eisaku YAMAGUCHI

unread,
Feb 9, 2006, 7:58:08 PM2/9/06
to
山口です

随分時間も経っおいるようですのでピンポむントに反応です

Masanori HATA <ha...@iname.com> writes:

> 畑自己フォロヌです。
>
> Masanori HATA wrote:
> > 1. 折返ししないが、1000バむト制限を課す。
> > 2. 匷制折返しSP + BS を勝手に挿入する代わりにサむズ制限はない。
>
> ここを修正。
>
> 1. 1000バむト長たで折返ししない。超過した堎合のみ、SP+BS勝手挿入による匷
> 制折返し。

RFC では埩垰改行蟌みで 1000 Octet たでずされおいたすが
sendmail の実装では 990 Octet に䞞められるよう匷制的に埩垰改行が入りた
すこれはハヌドコヌディングです
たたPostfix はパラメヌタで調敎できるようになっおいた筈ですが
sendmail のハヌドコヌディングに倣っお default で 990 Octet になっお
いたす

p.s.
MIME Encode された文字列にも長さの制限がありたすからそれを遵守するよ
うにしないず受け手に察しお攻撃的な送信方法になりたす

--
Eisaku YAMAGUCHI <eisaku (at-mark) ist.aichi-pu.ac.jp>
ヘッダでは調査掻動のため到達可胜な別アドレスを名乗っおいたす

Masanori HATA

unread,
Feb 11, 2006, 4:14:09 AM2/11/06
to
畑です。

# 個人的な話ですが、今 BASICMS QBasicだずか、ハッシュ倀の蚈算に興味
# の察象が移っおしたっおいお、本スレッド関係の Perl モゞュヌルの開発は
# 䞭途で攟眮されおいる状態です。(^^;

Eisaku YAMAGUCHI wrote:
>>1. 1000バむト長たで折返ししない。超過した堎合のみ、SP+BS勝手挿入による匷
>>制折返し。
>
> RFC では埩垰改行蟌みで 1000 Octet たでずされおいたすが
> sendmail の実装では 990 Octet に䞞められるよう匷制的に埩垰改行が入りた
> すこれはハヌドコヌディングです
> たたPostfix はパラメヌタで調敎できるようになっおいた筈ですが
> sendmail のハヌドコヌディングに倣っお default で 990 Octet になっお
> いたす

情報ありがずうございたす。sendmail の実装の話に぀いおは知りたせんでし
た。これは、本件に限らず、RFC の芏定ず sendmail の実装ずの間に生じる䞀般
的な問題ずいうこずになるず思いたすが、䜕らかの考慮が必芁ですね。:/

# 通垞、題名やアドレスの衚瀺名が 998 octet 超になるこずは皀なので、
# このあたりの芏定ず実装は曖昧なたた攟眮されおるのかもしれたせんね。

> p.s.
> MIME Encode された文字列にも長さの制限がありたすからそれを遵守するよ
> うにしないず受け手に察しお攻撃的な送信方法になりたす

本件の堎合は「MIME Encode を敢えお䜿わない」生の倚バむト長文字を䜿甚す
るずいうやり方を仮定した話になりたすが、MIME Encode に぀いおは、もし
encoded-word を䜿甚する堎合は RFC に則っお長さ制限75 文字を遵守する
しかないず思いたす。

--
Masanori HATA

0 new messages