chasen20.lzh ( Filesize: 5,139,707 )
形態素解析システムはあらゆる種類の日本語解析の前処理として必須のプロセスです.本システムは,計算機による日本語解析を志す多くの研究者が利用可能なように,使用者によって品詞体系,単語認定基準などを容易に変更できるよう配慮しています.
茶筌システムの原形は,京都大学長尾研究室および奈良先端科学技術大学院大学 松本研究室において開発された日本語形態素解析システムJUMAN(version2.0)です.今回リリースした 茶筌 version 2.0 では,従来の 茶筌 version 1.0 から大幅な改良が加えられており,解析速度と解析精度が向上しています.辞書に関しては,情報処理振興事業協会による独創的先進的情報技術に係わる研究開発「日本語ディクテーション基本ソフトウェアの開発」の一環として開発された ipadic1.01 に独自の修正を加えたipadic2.0 を用いています.
茶筌 version 2.0 for Windows には専用のGUIである WinCha 2000 を添付しています.WinCha 2000 を用いれば,簡単に形態素解析を行うことができます.また,コーパス作成ツールとしても利用可能です.
上記の Windows 版以外にも Unix システム用のアーカイブを用意しています.詳しくは茶筌ホームページをご覧ください.
http://cl.aist-nara.ac.jp/lab/nlt/chasen.html
ソフト名: | 茶筌 |
---|---|
動作OS: | Windows NT/98/95 |
機種: | 汎用 |
種類: | フリーソフト |
作者: | 茶筌管理開発担当者集団 山下 達雄 浅原 正幸 松本 裕治 平野 善隆 北内 啓 松田 寛 |