YAPC::Asia Tokyo 2014

Aug. 28, 29, 30 at KEIO Univ. Hiyoshi Campus [There Is More Than One Way To Enjoy It!]

Talk Information

How to customize the Japanese morphological analysis dictionary with Perl

This talk is currently in 'Rejected' state

Abstract

世の中の流行に関する調査や、自社製品に関する口コミの分析、震災時の安否情報の解析などの処理をなるべく自動的におこなう場合に、形態素解析器の辞書を目的に合わせてカスタマイズすることで処理結果を改善できることは知られています。

本トークでは、Text::Mecab::Dict::IndexerというPerlモジュールを具体例としてとりあげ、「Wikipediaやはてなキーワードのタイトルに一定のコストを付与して辞書のエントリに加える」以上のことを手軽におこなう方法とその裏側をご紹介いたします。

具体的には以下の項目について述べます。

  • 形態素解析とは
  • 日本語形態素解析器に添付されている辞書
  • 固有表現抽出とは
  • 目的にあわせた形態素解析器とは
  • Text::Mecab::Dict::Indexer とは
  • 日本語形態素解析器辞書をカスタマイズする
  • カスタマイズした辞書の応用例
  • 応用例における実験結果とその評価

などについてお話しする予定です。

自然言語処理の研究者ではないエンジニアは日本語形態素解析器の辞書をどの様にカスタマイズするのが妥当なのか、や、具体的に何をすれば良いのか、についてお伝えしたいと思います。


Talk Details

Venue TBD
Starts On TBD
Talk Category Libraries
Language Japanese
Slide Subtitles Japanese
Talk Duration 20 minutes
Material (Difficulty) Level Regular
May we take your photo? allow
May we record your talk? allow