How to customize the Japanese morphological analysis dictionary with Perl
This talk is currently in 'Rejected' state
Abstract
世の中の流行に関する調査や、自社製品に関する口コミの分析、震災時の安否情報の解析などの処理をなるべく自動的におこなう場合に、形態素解析器の辞書を目的に合わせてカスタマイズすることで処理結果を改善できることは知られています。
本トークでは、Text::Mecab::Dict::IndexerというPerlモジュールを具体例としてとりあげ、「Wikipediaやはてなキーワードのタイトルに一定のコストを付与して辞書のエントリに加える」以上のことを手軽におこなう方法とその裏側をご紹介いたします。
具体的には以下の項目について述べます。
- 形態素解析とは
- 日本語形態素解析器に添付されている辞書
- 固有表現抽出とは
- 目的にあわせた形態素解析器とは
- Text::Mecab::Dict::Indexer とは
- 日本語形態素解析器辞書をカスタマイズする
- カスタマイズした辞書の応用例
- 応用例における実験結果とその評価
などについてお話しする予定です。
自然言語処理の研究者ではないエンジニアは日本語形態素解析器の辞書をどの様にカスタマイズするのが妥当なのか、や、具体的に何をすれば良いのか、についてお伝えしたいと思います。
Talk Details
Venue | TBD |
---|---|
Starts On | TBD |
Talk Category | Libraries |
Language | Japanese |
Slide Subtitles | Japanese |
Talk Duration | 20 minutes |
Material (Difficulty) Level | Regular |
May we take your photo? | allow |
May we record your talk? | allow |