川幡です。
最初にOPACを使ったときは、この表記法にびっくりしたのですが…まぁすぐに慣
れました。
>> <
53B121C3-8D0F-4A5B...@apple.com> で,
>> 木田さん は書きました.
> その点、epubcafe の制作基本チュートリアルに「このチュートリアルでは,
> 著者名の表記方法について,国立国会図書館の[書誌データ作成ツール]が定義
> する読みの付与基準を参考にしています
> (
http://www.ndl.go.jp/jp/library/data/yomi.html)」と参考になる資料が
> 示されているのはよいことだと思います。が、この資料のルールに気になる点
> がありました。一点は、このルールが現実的ではないように見える事、もう一
> 点は、一般的なユーザーの期待と異なる排列になる事です。
多分、木田さんの課題は、(1) ある程度、file-as 属性に表記の揺れがあっても、
端末に依存することがない形で、比較・検索できるようにして欲しい、というこ
とと、(2) できるだけ、タイトルから file-as 属性は自動的に作れるようにして
欲しい、という2つに分かれるのではないかと思います。
で、多分、(1) についてはすでに規格として JIS X 4081 や、ISO/IEC 14651 が
あって(この中には正規化も含まれます)、これを「書誌データ」でも一般の人
が違和感なく検索できるよう、ある程度tailoring することはできるかもしれま
せんが、あまり規格から離れても追随できる端末は限られるのではないかと思い
ます。
(2) についても、書誌データの作成ルールが現在のようになった背後にある程度、
合理的な理由がある気がしていて、まずはこのようなルールになった背景も調べ
てみるのはいいんじゃないかな、と思います。素人考えですが、たとえば「蝶々」
の「ちょうちょう」というタイトルの本が、旧仮名遣いなら file-as が「てふて
ふ」になって、新仮名遣いなら file-as が「ちょうちょう」になって、ソート時
にこの2つの本の位置が離れるのは困ると思いますし、分かち書きについても、
たとえば「おおまめたいちろう」さんという人がいた場合、ソート時に「おおま
め・たいちろう」さんが、「おおまめた・いちろう」さんより前に来て欲しい、
という要望はあるんじゃないかな、という気もします。
日本語は表記と音の揺れが大きな言語だと思うので、タイトルから file-as を自
動生成するのは、(暫定で済むのでなければ)ある程度ツールの助けを借りても
本質的に難しく、それなりに本の製作者が汗をかかなければいけないものじゃな
いかな、と漠然と思っていました。
そもそも、一般コンシューマーの方が、「本のタイトルを付ける」機会がどれく
らいあるのか、特に、旧仮名遣いの本を作る機会がどれくらいあるのか、という
のもよく分かりませんでしたし…
一方で、電子書籍のメタデータのfile-asがどうなっていたとしても、図書館の人
は電子書籍が納本された際、黙々と書誌ルールに従って本のタイトルをつけ直し
てデータベースに納め、結果として図書館のOPACを検索するときにはどちらでも
検索できるようになるのかもしれない、とも思います。
> 専門家のの使用する書籍データベースを作ろうとしているなら、書誌データの
> ルールに会わせるのが合理的であるように思えますが、一般コンシューマーユー
> ザーが使うためのインターフェースとしては問題があるように思えます。もっ
> とユーザーの期待に近い、また、自動化処理が開発しやすく精度よく行えるよ
> うなルールが必要なように思えます。
> 例えば下のようなルールなら、もっと精度よく、作成時もランタイムでも自動
> 的な処理がしやすく、またユーザーの期待に添った結果を出せるんじゃないで
> しょうか。
> ・分かち書きをしない。
> ・漢字以外は綴りのまま。
> ・文字種(全角など)の正規化を行う
> ・空白文字の正規化と掃除(例えば空白の連続)
> ・file-as は、対応する文字列の単純な変換である事。例えば、語の順番を入
> れ替えたり、新たな語や記号を付け足したり、削除したり、サブタイトルのた
> めに使ったり、タイトルの説明に使ったり、別名にしたり、しない。(これ、
> 書かなくても当たり前のように見えますが、ここで「例えば」と挙げた例は全
> て iTunes の楽曲の読みに登場します。)
> ・など…
--
---------------------------------------------------------------------
川幡 太一 (
kawabat...@gmail.com) KAWABATA, Taichi