I meant to send this to the list a while ago.
There is another on the unidic-users list I'll forward too.
Jim
---------- Forwarded message ----------
From: Toshinobu OGISO <
tog...@kokken.go.jp>
Date: 2009/8/14
Subject: [unidic-users 38] 近代文語UniDic1.1のご案内
To:
unidic...@kokken.go.jp,
lingu...@cyber.sist.chukyo-u.ac.jp
(重複して受け取られた場合はご容赦ください)
近代文語UniDic 1.1のご案内
このたび「近代文語UniDic」 ver.1.1を公開しました。
近代文語UniDicは日本語形態素解析辞書UniDicをもとにして近代文語文を解析
できるようにした形態素解析辞書です。「短単位」や「見出しの階層構造」な
どのUniDicの特長をそのまま引き継いでいます。
解析対象は主として明治期の文語論説文(明治普通文)で、一般的な文章であ
れば96~98%程度の精度で解析できています。
(文学作品や難解な文章、他の時代のテキストでは精度が下がります。)
形態素解析システム「和布蕪(MeCab)」と「茶筌(ChaSen)」で利用できる
UTF-8版の辞書を公開しています。また、簡単に利用できるようにまとめた
Windows用パッケージを用意しています。
Ver.1.1では、現代語版UniDicのアップデートにあわせて品詞体系を修正した
ほか、MeCab版の辞書に仮名形やアクセント型などを出力するようにしました。
見出し語や品詞体系は、現代語版UniDic 1.3.12と互換性があります。
近代文語UniDicは次のページから無償でダウンロードできます。
http://www.kokken.go.jp/lrc/index.php?UniDic%2F%B6%E1%C2%E5%CA%B8%B8%ECUniDic
※なお、現代語版のUniDicについては次のページをご覧ください。
http://download.unidic.org
--
国立国語研究所 研究開発部門 言語資源グループ
小木曽 智信 (おぎそ としのぶ)
--
Jim Breen
Adjunct Snr Research Fellow, Clayton School of IT, Monash University
Treasurer: Hawthorn Rowing Club, VCA Secondary School, Japanese Studies Centre
Graduate student: Language Technology Group, University of Melbourne