ふーむ!
--
Tai
ついにという感じですが、コアのコミッターが言語特有の問題を知らず、かつ説明されても理解や検証がしにくいというのが最大のネックになりそうですね。
ある言語圏の誰かが希望の実装を述べたとして、コミッターはその善し悪しを100%の理解を持って判断する術を持っていないというのが実情でしょう。言い分を鵜呑みにするか、モヤモヤしたまま放置するか。前者の対応の場合、偏ったり誤ったコードがコアに実装されてしまう可能性があります(過去に例があり)。後者の場合、チケットがコアに取り込まれるのに時間がかかったり、手つかずのままになってしまいます(これもたくさんの例あり)。
こういった現状が改善されない限りは、言語特有の問題をすべてコアでやるというのは理想論であって難しいと思います。みなさんはどうお考えですか。
--
tenpura
例えば Multibyte Patch などのようなことはプラグインでやりたい、やるべき、ということなら
それを IRC なり Polyglots ブログなりで伝えていく必要がありますね。
幸い Sergey がアサインされて、コアの他の人(英語圏の人)よりも理解してくれるところは
あると思いますが、マルチバイトや日本語のニーズについては分からないところも多々あると
思うので、うまく共有していけると良いですね。
さしあたってはスレッドにコメントしつつ、IRC に参加してみたいと思います。
2011/12/20 tenpura <210...@gmail.com>:
> --
> WordPress 日本語版作成チーム
> http://groups.google.com/group/wp-ja-pkg?hl=ja
> http://ja.wordpress.org/about-wp-ja/
2011年12月20日10:44 tenpura <210...@gmail.com>:
> --
> WordPress 日本語版作成チーム
> http://groups.google.com/group/wp-ja-pkg?hl=ja
> http://ja.wordpress.org/about-wp-ja/
--
Tai
JOTAKI, "Tai"suke / 上滝 太祐
tek...@gmail.com
http://tekapo.com
jaからだとマルチバイトパッチの機能を少しでも取り込んでもらうのにどうしてもtenpuraさんの負担が大きくなっちゃうと思いますが、私もなるべく検証したりtracに書き込んだりして手伝いますんでぜひぜひ!
2011年12月20日13:20 Naoko McCracken <in...@nao-net.com>:
--
--
tenpura
WP Multibyte Patch の現在の文字数カウントは単純な文字数の合計です。
「Word プレス」 = 8 (4半角英文字 + 1半角スペース + 3マルチバイト文字)
それに対し中国語圏で望まれているカウントは
「Word プレス」 = 4 (1英単語 + 3マルチバイト文字)
と日本語ユーザーには非実用的と思われる方式です。
英語のユーザーには後者の実装でも通常の英単語のカウントに支障がないため、nacin達からはなんとなく、これでいいんじゃないの?的な雰囲気を感じます。
仮に後者の実装のみが取り入れられたとしても、英語圏と中国語圏がカバーされるという意味では前進でありますし、 WP Multibyte Patch において対応済みの箇所でありますので、日本語圏においては正直問題とならないところではあります。
とりあえずですが、日本語には前者(単純な文字数カウント)の方式が適切だろうという私の判断に関し反対意見等はございませんでしょうか?
--
Kuraishi (tenpura)
もちろん前者が適切というのに同意、賛成ですが、もし後者になった場合について1つ質問があります。
英単語、全角英単語、記号、日本語が混在かつ半角スペース一切無い場合、正しくカウントできるのでしょうか?
クライアントのメールとか見てると往々にして全角で英単語入力してたりするので、ちょっと気になりました。
(それこそ日本人固有の問題ですが ^^;;)
> とりあえずですが、日本語には前者(単純な文字数カウント)の方式が適切だろうという私の判断に関し反対意見等はございませんでしょうか?
私も、日本語では前者のほうが適切だろうと思います。
--
Mako N
おそらく中国語は漢字一文字をひとつの単語としてみなせるのでそのほうが都合いいのでしょうね。
できればwp-config.phpあたりで単語カウントか文字カウントかを選択できればいいのですが。。
2012年2月8日20:39 Mako N <ma...@pasero.net>:
私も日本語の場合はこのカウント方法が良いと思います。
こういうカウントをするのは日本語だけなんでしょうかね?
もしも IRC チャットがあるようなら教えてくださいー
Nao
その後進展がありまして、意外なことに日本語用の文字カウントを優先した形での実装の提案がありました。まだ未定ですが、翻訳ファイルの中でフラグを立てて単語カウントか文字カウントかを選べるようになりそうです。
@おでさん
> 英語圏(と中華圏)的には、半角スペースをカウントするのが問題になるのでしょうか?
中国語に関しては私もたぶん
> おそらく中国語は漢字一文字をひとつの単語としてみなせるのでそのほうが都合いいのでしょうね。
なのかと思いますが、英語ではやはり単語でのカウントが一般的のようですね。
@加藤さん
> もちろん前者が適切というのに同意、賛成ですが、もし後者になった場合について1つ質問があります。
> 英単語、全角英単語、記号、日本語が混在かつ半角スペース一切無い場合、正しくカウントできるのでしょうか?
コードを見た限りですが、その場合はもちろん正しくカウントできないと思います。
@Taiさん
> できればwp-config.phpあたりで単語カウントか文字カウントかを選択できればいいのですが。。
上に書いた通り選択する方法は提供されそうです。
@Naoさん
> 私も日本語の場合はこのカウント方法が良いと思います。
> こういうカウントをするのは日本語だけなんでしょうかね?
ポーランドの方からは日本語同様の文字カウントが良いという意見が出ています。たぶん中国語のようなハイブリッドなカウントの方が稀だと思いますが、人口がすごいですから考慮する必要はありでしょうね。
--
Kuraishi (tenpura)