Talk Information

This talk is currently in 'Rejected' state

世の中の流行に関する調査や、自社製品に関する口コミの分析、震災時の安否情報の解析などの処理をなるべく自動的におこなう場合に、形態素解析器の辞書を目的に合わせてカスタマイズすることで処理結果を改善できることは知られています。

本トークでは、Text::Mecab::Dict::IndexerというPerlモジュールを具体例としてとりあげ、「Wikipediaやはてなキーワードのタイトルに一定のコストを付与して辞書のエントリに加える」以上のことを手軽におこなう方法とその裏側をご紹介いたします。

具体的には以下の項目について述べます。

などについてお話しする予定です。

自然言語処理の研究者ではないエンジニアは日本語形態素解析器の辞書をどの様にカスタマイズするのが妥当なのか、や、具体的に何をすれば良いのか、についてお伝えしたいと思います。