YAPC::Asia TOKYO 2012

Take Another Step Forward

SEPTEMBER 27,28 & 29th

トーク情報

タイトル

Perlでデータクリーニング

トーク概要

本発表では Perl と自然言語処理技術を使った日本語を含むデータのクリーニングや、データの質を高める運用ルールについて、例を挙げつつお話いたします。

きれいで無駄が少なく便利なデータをゼロから、または、既存のデータから作り、さらにそれを維持するためには多くの人件費がかかります。

そして、その人件費はソフトウェアと自然言語処理技術により人間の作業をサポートすることや、運用時のルール作りを工夫することで少なからず削減できます。

本発表でお話する内容を理解するのに必要な Perl や自然言語処理関連の知識はありません。事前にお手元のアプリケーションで使われている"きれいにしたいデータ"を見つけてから本発表をお聞きいただけると、より円滑に内容を理解できると思います。

このエントリーをはてなブックマークに追加

トーク詳細

会場 3F Room 2
開始時間 2012-09-28 11:30:00
カテゴリ チュートリアル
言語 日本語
スライド字幕 none
時間 20 分
想定観客層 レギュラー

動画

スライド

スライドは登録されてません