Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

dessed

15 views
Skip to first unread message

Junn Ohta

unread,
Oct 16, 2003, 12:28:09 AM10/16/03
to
ステムソフト電子辞典シリーズをEPWINGに変換する藤井
さんのdessedですが、hishidaさんのEB series support
pageで0.3になってますね。新編英和活用大辞典に対応
したということのようです。

ところで、dessedのドキュメントには

システムソフトの電子辞典シリーズには新・旧2つの
フォーマットがあり、dessedで変換できるのは新形式
のみです。旧形式...は変換できません。

と書かれているのですが、この「旧形式」はどれを指し
ているのでしょう?

手もとにあるシステムソフト電子辞典の辞書ファイル構
成は以下のようになっています。V1.0にはdessedが読も
うとするカタログ相当のファイルがありません。V2.0と
V3.0はファイル構成は同じですが、V2.0をdessed 0.3で
変換した結果はEPWINGとして読めないようです。

dessedのソースにあるunix/README.eucには

** What is this?
システムソフト電子辞典の Version 3 (多分?) の圧
縮を展開します。展開するとちょっと EPWING2 形式
のようになるようです。

とあって、V2.0には対応していないことが見てとれるの
ですが、藤井さんのほうではこのV2.0形式についてどの
程度情報をおもちでしょうか?

以下それぞれの辞書ファイル名と日付です。

●岩波国語辞典 (検索ソフトはV1.0)
IWANAMI DAT 628,701 96-01-15 13:34 IWANAMI.DAT
IWANAMI DIC 4,171,759 96-01-15 13:42 IWANAMI.DIC
IWANAMI1 IDX 1,225,572 96-01-15 13:33 IWANAMI1.IDX
IWANAMI2 IDX 1,225,572 96-01-16 10:46 IWANAMI2.IDX
IWANAMI3 IDX 1,180,596 96-01-16 10:47 IWANAMI3.IDX
・構造が違う。IDXファイル(カタログ相当?)もない

●研究社新英和・和英中辞典 (検索ソフトはV1.0)
(1) 新英和中辞典
KENKUEJ DAT 1,575,905 95-10-23 10:49 KENKUEJ.DAT
KENKUEJ DIC 9,350,405 95-10-12 13:22 KENKUEJ.DIC
KENKUEJ1 IDX 1,165,862 95-09-14 17:57 KENKUEJ1.IDX
KENKUEJ2 IDX 1,165,862 95-09-14 18:45 KENKUEJ2.IDX
(2) 新和英中辞典
KENKUJE DAT 438,718 96-01-29 16:17 KENKUJE.DAT
KENKUJE DIC 7,202,597 95-12-15 18:04 KENKUJE.DIC
KENKUJE1 IDX 877,634 96-01-29 15:45 KENKUJE1.IDX
KENKUJE2 IDX 877,634 96-01-29 16:15 KENKUJE2.IDX
KENKUJE3 IDX 759,238 96-01-29 16:14 KENKUJE3.IDX
・構造が違う。IDXファイル(カタログ相当?)もない

●広辞苑第四版 (検索ソフトはV2.0β)
BHINDEX DIC 5,317,999 97-08-07 16:16 BHINDEX.DIC
BHTITLE DIC 4,750,867 97-08-07 16:20 BHTITLE.DIC
BKINDEX DIC 4,106,950 97-08-07 16:09 BKINDEX.DIC
BKTITLE DIC 2,966,512 97-08-07 16:11 BKTITLE.DIC
FHINDEX DIC 5,165,056 97-08-07 16:01 FHINDEX.DIC
FHTITLE DIC 4,864,576 97-08-07 16:05 FHTITLE.DIC
FKINDEX DIC 3,873,331 97-08-07 15:54 FKINDEX.DIC
FKTITLE DIC 3,083,470 97-08-07 15:56 FKTITLE.DIC
GA16FULL 71,680 96-11-06 17:00 GA16FULL
GA16HALF 4,096 96-11-06 17:00 GA16HALF
HONMON DIC 23,560,627 97-08-07 15:50 HONMON.DIC
KOUJIEN IDX 1,288 97-08-21 9:36 KOUJIEN.IDX
・dessedでエラーなく変換できるが、結果は正しいEPWINGでない。
(cdrom2がerrorになる。squeezeはcore dumpする。)

●日外難読語・固有名大辞典 (検索ソフトはV2.0)
(1) 地名・河川名
BHINDEX DIC 2,980,996 98-09-23 9:58 BHINDEX.DIC
BHTITLE DIC 2,031,934 98-09-23 9:55 BHTITLE.DIC
FHINDEX DIC 2,913,592 98-09-23 9:53 FHINDEX.DIC
FHTITLE DIC 2,100,985 98-09-23 9:51 FHTITLE.DIC
GAI16F 4,096 98-07-01 14:51 GAI16F
HONMON DIC 2,838,457 98-09-23 9:49 HONMON.DIC
NANDOKU1 IDX 1,048 98-09-23 10:14 NANDOKU1.IDX
(2) 神社・寺院
BHINDEX DIC 843,589 98-08-24 17:36 BHINDEX.DIC
BHTITLE DIC 568,012 98-08-24 17:36 BHTITLE.DIC
FHINDEX DIC 849,112 98-08-24 17:35 FHINDEX.DIC
FHTITLE DIC 594,976 98-08-24 17:34 FHTITLE.DIC
GAI16F 4,096 98-07-01 14:51 GAI16F
HONMON DIC 1,351,222 98-08-24 17:34 HONMON.DIC
NANDOKU2 IDX 1,048 98-09-17 9:56 NANDOKU2.IDX
(3)日本文学作品
BHINDEX DIC 1,393,987 98-08-24 18:01 BHINDEX.DIC
BHTITLE DIC 1,445,872 98-08-24 18:00 BHTITLE.DIC
FHINDEX DIC 1,374,505 98-08-24 17:59 FHINDEX.DIC
FHTITLE DIC 1,502,776 98-08-24 17:58 FHTITLE.DIC
GAI16F 8,192 98-07-01 14:52 GAI16F
HONMON DIC 1,603,348 98-08-24 17:56 HONMON.DIC
NANDOKU3 IDX 1,048 98-09-17 9:57 NANDOKU3.IDX
(4) 動植物・一般
BHINDEX DIC 1,519,519 98-09-23 10:10 BHINDEX.DIC
BHTITLE DIC 1,265,050 98-09-23 10:09 BHTITLE.DIC
FHINDEX DIC 1,529,665 98-09-23 10:08 FHINDEX.DIC
FHTITLE DIC 1,378,057 98-09-23 10:06 FHTITLE.DIC
GAI16F 8,192 98-07-01 14:52 GAI16F
GAI16H 4,096 98-07-01 14:52 GAI16H
HONMON DIC 1,863,388 98-09-23 10:05 HONMON.DIC
NANDOKU4 IDX 1,096 98-09-23 10:14 NANDOKU4.IDX
・dessedでエラーなく変換できるが、結果は正しいEPWINGでない。
(cdrom2がerrorになる。squeezeはcore dumpする。)

●研究社新英和・和英中辞典 (検索ソフトはV3.0)
BHINDEX DIC 5,209,756 99-09-07 19:56 BHINDEX.DIC
BHTITLE DIC 3,062,098 99-09-07 21:17 BHTITLE.DIC
DICPROF INI 570 99-10-08 17:37 DICPROF.INI
FHINDEX DIC 4,953,385 99-09-07 19:52 FHINDEX.DIC
FHTITLE DIC 2,925,667 99-09-07 21:15 FHTITLE.DIC
GAI16F00 6,144 96-04-04 13:24 GAI16F00
GAI16H00 6,144 96-04-04 13:24 GAI16H00
HONMON DIC 33,175,939 99-10-16 16:56 HONMON.DIC
KENCHU IDX 1,144 99-10-16 17:54 KENCHU.IDX
PCMDATA DIC 116,465,389 99-09-07 22:22 Pcmdata.dic
・dessedで変換でき、結果もEPWINGとして読める。

●研究社新編英和活用大辞典 (検索ソフトはV3.0)
BHINDEX DIC 898,057 99-09-03 14:39 BHINDEX.DIC
BHTITLE DIC 1,361,374 99-09-03 16:49 BHTITLE.DIC
DICPROF INI 607 99-10-15 16:51 DICPROF.INI
FHINDEX DIC 891,268 99-09-03 14:39 FHINDEX.DIC
FHTITLE DIC 1,342,855 99-09-03 16:48 FHTITLE.DIC
GAI16F00 4,096 96-10-28 9:28 GAI16F00
GAI16H00 4,096 96-10-28 9:28 GAI16H00
HONMON DIC 27,971,557 99-10-16 18:20 HONMON.DIC
KENCOLLO IDX 1,192 99-10-16 17:52 KENCOLLO.IDX
KWINDEX DIC 12,831,448 99-09-03 14:48 Kwindex.dic
KWTITLE DIC 83,356,075 99-09-03 15:55 Kwtitle.dic
・dessedで変換でき、結果もEPWINGとして読める。
--
太田純(Junn Ohta) (株)リコー/新横浜事業所
oh...@sdg.mdd.ricoh.co.jp

Fujii Hironori

unread,
Oct 16, 2003, 1:44:16 AM10/16/03
to
At 16 Oct 2003 04:28:09 GMT,

Junn Ohta wrote:
>
> ステムソフト電子辞典シリーズをEPWINGに変換する藤井
> さんのdessedですが、hishidaさんのEB series support
> pageで0.3になってますね。新編英和活用大辞典に対応
> したということのようです。

どうやらバグフィクスして下さったようで、
どうもありがとうございます。 > hishida さん

> ところで、dessedのドキュメントには
>
> システムソフトの電子辞典シリーズには新・旧2つの
> フォーマットがあり、dessedで変換できるのは新形式
> のみです。旧形式...は変換できません。
>
> と書かれているのですが、この「旧形式」はどれを指し
> ているのでしょう?

ちなみにこの情報の大本は、Jammingのページでして、そこには、

http://dicwizard.jp/jamming_ug/formats/format_ss.html

システムソフト電子辞典シリーズには新型と旧型の2つのフォーマットがあり、
Jammingが対応しているのは新型フォーマットのみです。

とあります。

> 手もとにあるシステムソフト電子辞典の辞書ファイル構
> 成は以下のようになっています。V1.0にはdessedが読も
> うとするカタログ相当のファイルがありません。V2.0と
> V3.0はファイル構成は同じですが、V2.0をdessed 0.3で
> 変換した結果はEPWINGとして読めないようです。
>
> dessedのソースにあるunix/README.eucには
>
> ** What is this?
> システムソフト電子辞典の Version 3 (多分?) の圧
> 縮を展開します。展開するとちょっと EPWING2 形式
> のようになるようです。
>
> とあって、V2.0には対応していないことが見てとれるの
> ですが、藤井さんのほうではこのV2.0形式についてどの
> 程度情報をおもちでしょうか?

私がもっているのは古い2001年度版の
「システムソフト電子辞典 - ビジネスセット Ver.3.2」
だけでして、V2 のことは何も知りません。
よって、「旧形式」とはどれなのか、私は分かっていませんでした。
ただ、

http://hpcgi2.nifty.com/EBTools/bbs/wforum.cgi?no=235&reno=no&oya=235&mode=msgview&page=60
にて hishida さんが

確実ではありませんが、システムソフト電子辞典シリーズの
Ver2と3両方いけるようです。

と書かれてたので、V2 も動くものと思ってました。

ついでに、
http://homepage2.nifty.com/EBTools/dessed/index.html
の「変換が確認されているタイトル」にも、V2らしきものがいつくかあるようです。

- 「The American Heritage Dictionary of The English Language,
Third Editon with Thesaurus and Idioms」(Ver.2.0)
- 「マイペディア99テキスト版」
- 「研究社リーダーズ・プラス」(※体験版で確認)

もしかすると「変換が確認された」と「動作が確認された」の
違いかも知れませんが。

---
藤井宏憲

Junn Ohta

unread,
Oct 16, 2003, 1:40:24 AM10/16/03
to
fj.comp.applications.dictionaryの記事<bml6op$s3t$1...@ns.src.ricoh.co.jp>で
私は書きました。

> とあって、V2.0には対応していないことが見てとれるの
> ですが、藤井さんのほうではこのV2.0形式についてどの
> 程度情報をおもちでしょうか?

日外難読語・固有名大辞典の寺院・神社名(NANDOKU2)を
dessedで変換したものを、hishidaさんのEBDumpで見て
みました。インデックスチェックをかけてみたところ、
どうやらインデックスは正常のようです。

しかし、本文や見出しをテキストダンプすると、ちゃん
と変換できている部分とそうでない部分とが、数十ブロ
ックごとに交互に出てきます。正常な部分には

<1F09><0001><1F41><0100>...

変換に失敗している部分には

<0A1F><0900><011F><0044>...

のようなタグが見られるので、どうやらどこかで1バイ
トずれているような感じですね。

Fujii Hironori

unread,
Oct 16, 2003, 1:55:38 AM10/16/03
to
At 16 Oct 2003 05:40:24 GMT,
Junn Ohta wrote:
>
> のようなタグが見られるので、どうやらどこかで1バイ
> トずれているような感じですね。

圧縮を展開するところでももう一個バグがあるのかな。

---
藤井宏憲

Fujii Hironori

unread,
Oct 16, 2003, 9:01:09 PM10/16/03
to
ひとつ気になることがありまして、
dessed でうまくいかない辞書をお持ちの方で手伝って頂けると
幸いです。

http://hp.vector.co.jp/authors/VA023689/misc/undic.c

$ a.out honmon.dic honmon.

とすると、下のようなファイル名で展開されます。

total 9896
-rw-r--r-- 1 fujii fujii 32768 2003-10-17 09:36 honmon.0000
-rw-r--r-- 1 fujii fujii 32768 2003-10-17 09:36 honmon.0001
-rw-r--r-- 1 fujii fujii 32768 2003-10-17 09:36 honmon.0002
-rw-r--r-- 1 fujii fujii 32768 2003-10-17 09:36 honmon.0003
(...)
-rw-r--r-- 1 fujii fujii 32768 2003-10-17 09:36 honmon.0134
-rw-r--r-- 1 fujii fujii 6144 2003-10-17 09:36 honmon.0135


2048 バイトの倍数のファイルが出来ます。
4096, 8192, 16384, 32768 になると思います。
もしかすると、それ以外のサイズのファイルがありますか?

---
藤井宏憲

Fujii Hironori

unread,
Oct 16, 2003, 9:05:43 PM10/16/03
to
At Fri, 17 Oct 2003 10:01:09 +0900,

Fujii Hironori wrote:
>
> 2048 バイトの倍数のファイルが出来ます。
> 4096, 8192, 16384, 32768 になると思います。

2048 バイトの倍数は、
2048 4096 6144 8192 10240 12288 14336 16384 18432 20480 22528 24576
26624 28672 30720 32768 でした。

それよりも、1,2,3バイト大きいか小さいか、そんなファイルはありますか?

---
藤井宏憲

Junn Ohta

unread,
Oct 16, 2003, 11:55:43 PM10/16/03
to
fj.comp.applications.dictionaryの記事<bmnp3v$mf2$1...@ns.src.ricoh.co.jp>で
私は書きました。
> 21バイト大きい(32768に対して32791)

21バイト → 23バイト (^^;

Junn Ohta

unread,
Oct 16, 2003, 11:53:35 PM10/16/03
to
fj.comp.applications.dictionaryの記事<871xtcwu54.wl%fu...@chi.its.hiroshima-cu.ac.jp>で
fu...@chi.its.hiroshima-cu.ac.jpさんは書きました。

> 2048 バイトの倍数は、
> 2048 4096 6144 8192 10240 12288 14336 16384 18432 20480 22528 24576
> 26624 28672 30720 32768 でした。
> それよりも、1,2,3バイト大きいか小さいか、そんなファイルはありますか?

21バイト大きい(32768に対して32791)ファイルもありま
した。

以下はls -lの出力からサイズだけを残して
sort -n | uniq -c
した結果です。

研究社新英和・和英中辞典V3.0 → OK
1 26624
2730 32768

広辞苑第四版V2.0 → NG
9 32768
105 32770
173 32771
213 32772
141 32773
122 32774
85 32775
45 32776
53 32777
38 32778
27 32779
27 32780
26 32781
17 32782
17 32783
10 32784
2 32785
1 32786
1 32787
1 32789

日外難読語・固有名大辞典V2.0 地名・河川名 → NG
1 18441
14 32768
18 32770
30 32771
15 32772
24 32773
11 32774
21 32775
9 32776
19 32777
9 32778
15 32779
7 32780
16 32781
11 32782
17 32783
8 32784
2 32785
1 32791

日外難読語・固有名大辞典V2.0 神社・寺院名 → NG
1 2050
7 32768
10 32770
15 32771
4 32772
8 32773
3 32774
8 32775
2 32776
7 32777
3 32778
12 32779
1 32780
10 32781
4 32782
9 32783
1 32784
2 32785
1 32787
1 32789

日外難読語・固有名大辞典V2.0 日本文学作品 → NG
1 8195
4 32768
10 32770
17 32771
12 32772
7 32773
18 32774
6 32775
5 32776
7 32777
3 32778
6 32779
7 32780
2 32781
1 32782
4 32783
4 32784
1 32785

日外難読語・固有名大辞典V2.0 動植物・一般 → NG
1 30725
3 32768
11 32770
9 32771
17 32772
7 32773
22 32774
7 32775
8 32776
10 32777
11 32778
5 32779
7 32780
3 32781
7 32782
5 32783
8 32784
2 32785

Fujii Hironori

unread,
Oct 17, 2003, 12:21:10 AM10/17/03
to
At 17 Oct 2003 03:53:35 GMT,

Junn Ohta wrote:
>
> fj.comp.applications.dictionaryの記事<871xtcwu54.wl%fu...@chi.its.hiroshima-cu.ac.jp>で
> fu...@chi.its.hiroshima-cu.ac.jpさんは書きました。
> > 2048 バイトの倍数は、
> > 2048 4096 6144 8192 10240 12288 14336 16384 18432 20480 22528 24576
> > 26624 28672 30720 32768 でした。
> > それよりも、1,2,3バイト大きいか小さいか、そんなファイルはありますか?
>
> 21バイト大きい(32768に対して32791)ファイルもありま
> した。
>
> 以下はls -lの出力からサイズだけを残して
> sort -n | uniq -c
> した結果です。
>
> 研究社新英和・和英中辞典V3.0 → OK
> 1 26624
> 2730 32768
>
> 広辞苑第四版V2.0 → NG
> 9 32768
(...)


たくさん実行結果をいただき、どうもありがとうございます。

私の予想とは大きく違いました。
どうやら、V2.0はアルゴリズムが微妙に違うようです。
dessed では V2.0 は不可能だと思います。
スライド窓のサイズとかなにかが違うのでしょう。
私はお手上げです。


もしも、がんばる方がいらっしゃいましたら、
笠原さんの ebdump.pl とかを使えば、

http://hp.vector.co.jp/authors/VA023689/misc/ebdump.pl

$ ll
total 128
-rw-r--r-- 1 fujii fujii 32768 2003-10-17 13:10 honmon.0000
-rw-r--r-- 1 fujii fujii 32768 2003-10-17 13:10 honmon.0001
-rw-r--r-- 1 fujii fujii 32768 2003-10-17 13:10 honmon.0002
-rw-r--r-- 1 fujii fujii 30720 2003-10-17 13:10 honmon.0003
$ ebdump.pl honmon.0000 1:0 | head
0001:000 1f021f0900011f4100011f611f0a1f02 1f021f0900011f4100011f611f0a1f02
0001:010 1f0900012223376b3a2748644f2a3163 1f090001[■][結][婚][披][露][宴]
0001:020 1f0a1f0a1f0900012178332b3163244e 1f0a1f0a1f090001[§][開][宴][の]
0001:030 3c2d1f0a1f0a1f0900012227332b3163 [辞]1f0a1f0a1f090001[▼][開][宴]
0001:040 244e3c2d214a3b4a32713c54214b1f0a [の][辞][(][司][会][者][)]1f0a
0001:050 1f0900021f4d00000000000000000000 1f0900021f4d00000000000000000000
0001:060 00000000006900301f6d1f0a1f090002 00000000006900301f6d1f0a1f090002
0001:070 212144392469242f242a4254243f243b [ ][長][ら][く][お][待][た][せ]
0001:080 2424243f2437245e2437243f2123243d [い][た][し][ま][し][た][。][そ]
0001:090 246c2447244f243f24403a232468246a [れ][で][は][た][だ][今][よ][り]
$

こんな感じでダンプできるので、
それを見ながら、いじればどうにかなるのではないかと思います。

---
藤井宏憲

Fujii Hironori

unread,
Oct 17, 2003, 1:00:50 AM10/17/03
to
At Fri, 17 Oct 2003 13:21:10 +0900,
Fujii Hironori wrote:
>
> もしも、がんばる方がいらっしゃいましたら、

V3 の情報がどれだけ訳に立つかは分かりませんが、
以前書いたメモを流しておきます。

---
システムソフト電子辞典シリーズ

*.DIC ファイル

JIS X 4081 の 1 block は 2048 byte (0x800 byte) 。

概略だけ書くと、
0x8000バイト毎に切って、オフセット長12bit、文字列一致長4bitの
LZ77 で圧縮したものを連結してあります。

16 block 分が 32768 byte, 0x8000 byte

LZ77 とは、
「x 文字前より y 文字コピー。その次が文字 `z'。」
このような x, y, z の繰り返し。

x: オフセット
y: 文字列一致長

1バイトは8ビットとします。基本的にビッグエンディアン。
ファイル構造はヘッダ部、オフセット部、チャンク部の三部構成。

* ヘッダ部

64バイト

00-08: SSEDDATA
09-0e: 不明。バージョン?
0f-0f: 種類?
10-15: 不明
16-17: チャンク数 n_chunk
18-1b: num1 先頭ブロック番号
1c-1f: num2 終了ブロック番号
20-3f: 不明


* オフセット部

n_chunk * 4 バイト

オフセットはファイルの先頭からチャンクの開始位置


* チャンク部

n_data * 3 + 5 バイト

00-02: ゼロ
03-04: データ数 n_data
05-05: ウィンドウの初期化文字

06-07: オフセット(12bit)と文字数(4bit)
08-08: 文字
...

o オフセット長は12bitだが、ウィンドウサイズは0xff0?
→ そのようです。

o ウィンドウは 0x00 での初期化でなく、05 にある文字で初期化?
→ そのようです。

o データ中に「2文字前より3文字コピー」といった感じのデータが含まれるが
この場合ウィンドウをリングバッファで実装するか、しないかで変わってくる。
→ LZ77の基本的テクニックでした。
「1文字前より10文字コピー」だってよし。

o 00-02 は n_data の上位?

o 圧縮を展開すると、すこしサイズが大きい。1byte大きい。
展開アルゴリズムがおかしい?
切り捨ててもいい?

---
藤井宏憲

Junn Ohta

unread,
Oct 17, 2003, 3:09:36 AM10/17/03
to
fj.comp.applications.dictionaryの記事<87wub4v4ot.wl%fu...@chi.its.hiroshima-cu.ac.jp>で
fu...@chi.its.hiroshima-cu.ac.jpさんは書きました。
> V3 の情報がどれだけ訳に立つかは分かりませんが、
> 以前書いたメモを流しておきます。

各ブロックをダンプしてみたところ、末尾にゴミがつい
ているだけで、あとは正常のようです。UNIX版のdessed
0.3に以下のパッチを当てて

広辞苑第四版 V2.0
日外難読語・固有名大辞典 V2.0

を変換してみたところ、いずれも正しくEPWINGに変換で
きました。このパッチはEB series support pageの掲示
板のほうにも貼っておきますね。

なお、広辞苑のほうは図版がないにもかかわらず本文中
に図版へのリンクがあるので、変換したものをそのまま
DDwinなどで検索すると異常終了します。いちどsqueeze
を通してやればその手のリンクは「→□」に変換される
ので、DDwinでも問題なく使えるようになります。

*** dessed.c.ORIG 2003年 10月 14日 (火)
--- dessed.c 2003年 10月 17日 (金)
***************
*** 137,142 ****
--- 137,148 ----

for (j=0; j<len; j++)
{
+ /*
+ * すでに32768バイト出力している、または最後の
+ * データで、すでに2048の倍数バイト出力している
+ */
+ if (pos >= 0x8000 || d == n_data-1 && !(pos & 0x7ff))
+ break;
w = wp + wintop;
if (w >= sizeof win)
w -= sizeof win;
***************
*** 149,157 ****
}

/*
! * 最後のデータで、既に2048の倍数バイト出力している
*/
! if (d == n_data-1 && !(pos & 0x7ff))
break;

win[wintop] = buff[2];
--- 155,164 ----
}

/*
! * すでに32768バイト出力している、または最後の
! * データで、すでに2048の倍数バイト出力している
*/
! if (pos >= 0x8000 || d == n_data-1 && !(pos & 0x7ff))
break;

win[wintop] = buff[2];

Junn Ohta

unread,
Oct 17, 2003, 9:19:12 AM10/17/03
to
fj.comp.applications.dictionaryの記事<87y8vl3ff3.wl%fu...@chi.its.hiroshima-cu.ac.jp>で
fu...@chi.its.hiroshima-cu.ac.jpさんは書きました。

> 確実ではありませんが、システムソフト電子辞典シリーズの
> Ver2と3両方いけるようです。
> と書かれてたので、V2 も動くものと思ってました。
> ついでに、
> http://homepage2.nifty.com/EBTools/dessed/index.html
> の「変換が確認されているタイトル」にも、V2らしきものがいつくかあるようです。

私が変換できないといっていた広辞苑や日外難読語・固
有名大辞典(あとリーダーズ英和辞典初版もありました)
はV2の初期のころからあったものです。コンテンツの圧
縮時に辞書ウインドー(この辞書はLZ77のスライド辞書
のことです)の最後のフラッシュで何かしくじっていて、
V2の途中でそれを修正したのかもしれませんね。

ところで、藤井さんお手持ちのコンテンツで、いったん
Windowsでインストールしないと辞書ファイルが取り出
せない製品はありますか? 私のところにあるものはすべ
てCD-ROM上に辞書ファイルがそのまま格納されているの
ですが...。UNIXのユーザーがdessedを使うときWindows
の介在なしには作業できない製品があるかどうか知りた
いのです。

Fujii Hironori

unread,
Oct 18, 2003, 12:44:01 AM10/18/03
to
At 17 Oct 2003 13:19:12 GMT,

Junn Ohta wrote:
>
> ところで、藤井さんお手持ちのコンテンツで、いったん
> Windowsでインストールしないと辞書ファイルが取り出
> せない製品はありますか? 私のところにあるものはすべ
> てCD-ROM上に辞書ファイルがそのまま格納されているの
> ですが...。UNIXのユーザーがdessedを使うときWindows
> の介在なしには作業できない製品があるかどうか知りた
> いのです。

私のには2枚のCD-ROMが付いてまして、Windows用とMac用です。
今、手許にある Windows用はインストールせずにCD-ROMから
そのまま取り出せます。
Mac用の方は自宅に置いているので今日は確認できません。

At 17 Oct 2003 07:09:36 GMT,


Junn Ohta wrote:
>
> 各ブロックをダンプしてみたところ、末尾にゴミがつい
> ているだけで、あとは正常のようです。UNIX版のdessed
> 0.3に以下のパッチを当てて

早くもパッチを当てた dessed 0.4 がリリースされましたね。

> なお、広辞苑のほうは図版がないにもかかわらず本文中
> に図版へのリンクがあるので、変換したものをそのまま
> DDwinなどで検索すると異常終了します。いちどsqueeze
> を通してやればその手のリンクは「→□」に変換される
> ので、DDwinでも問題なく使えるようになります。

EBシリーズ・サポート掲示板の話で、
seek で出来るギャップも squeeze で取れるんですね。
便利なツールがあって助かります。

---
藤井宏憲

Junn Ohta

unread,
Oct 18, 2003, 1:25:41 AM10/18/03
to
fj.comp.applications.dictionaryの記事<878ynjupda.wl%fu...@chi.its.hiroshima-cu.ac.jp>で
fu...@chi.its.hiroshima-cu.ac.jpさんは書きました。

> 私のには2枚のCD-ROMが付いてまして、Windows用とMac用です。
> 今、手許にある Windows用はインストールせずにCD-ROMから
> そのまま取り出せます。
> Mac用の方は自宅に置いているので今日は確認できません。

ありがとうございます。Mac用のほうも知識として知っ
ておきたいので確認していただけると助かります。

> 早くもパッチを当てた dessed 0.4 がリリースされましたね。

hishidaさんも素早いですね。このバージョンで手もと
にあるV3.0の製品(研究社新英和・和英中辞典と新編英
和活用大辞典)も変換できることを確認しました。

フォーマットの違うV1.0のほうも、ちゃんと調べれば変
換できそうなのですが、需要ないですよね...。

> EBシリーズ・サポート掲示板の話で、
> seek で出来るギャップも squeeze で取れるんですね。
> 便利なツールがあって助かります。

squeezeを作ったときは、まさかこんなふうに役立つと
は思ってもみなかったんですけど。(^^;

いろんなツールが出てきて、それぞれは単機能だけれど
複合的に使うとさまざまに便利なことができて、そうい
う意味で辞書まわりは数年前とくらべて格段に環境がと
とのってきたというイメージです。うれしいな。

あ、squeezeはぜひ私のオリジナルではなくて電子辞書
オープンラボのebutils-1.2preのほうを使ってください
ね。EPWING圧縮書籍にも対応してますし、新しい書籍に
含まれるタグにも対応してますから。

WindowsやDOSで動くバイナリーも含めて
eDict Snapshot
http://ebsnap.lkj.jp/
からもダウンロードできるようです。

Fujii Hironori

unread,
Oct 19, 2003, 12:50:53 AM10/19/03
to
At 18 Oct 2003 05:25:41 GMT,

Junn Ohta wrote:
>
> fj.comp.applications.dictionaryの記事<878ynjupda.wl%fu...@chi.its.hiroshima-cu.ac.jp>で
> fu...@chi.its.hiroshima-cu.ac.jpさんは書きました。
> > 私のには2枚のCD-ROMが付いてまして、Windows用とMac用です。
> > 今、手許にある Windows用はインストールせずにCD-ROMから
> > そのまま取り出せます。
> > Mac用の方は自宅に置いているので今日は確認できません。
>
> ありがとうございます。Mac用のほうも知識として知っ
> ておきたいので確認していただけると助かります。

Windows や GNU/Linux にて Mac 用の CD-ROM のマウント方法が分からず、
何も出来ませんでした。
eject だけはどちらのOSでも出来ましたが。

---
藤井宏憲

0 new messages