lionusの日記(旧はてなダイアリー)

「lionusの日記」http://d.hatena.ne.jp/lionus/としてかつてはてなダイアリーにあった記事を移転したものです。

福祉・心理・看護のテキストマイニング入門/Excelで学ぶテキストマイニング入門(レシピ本を読んだだけでは上手くならない。)

福祉・心理・看護のテキストマイニング入門

福祉・心理・看護のテキストマイニング入門

この本を参考にしつつ,KH Coderを利用してテキストマイニングなるものに挑戦しています(この本ではWordMinerが使われていますが,やることは似たようなものなので)。
Excelで学ぶテキストマイニング入門

Excelで学ぶテキストマイニング入門

ずっと以前に,この本も読んでみました。SPSS等統計パッケージが利用可能な場合は,Excelで全て,というのはちょっと面倒くさいな,と思ってそのままにしていましたが,今回再度参照して,自由記述データから抽出した語をどう取捨選択して分析にのせるか,という点は今でも参考になると思いました。
KH Coderを使うと,自由記述データからさっくりと語を抽出してくれます。類似語をくくるコーディングルールの設定とその実行が煩雑ですが,昔むかし,AUTOCODE*1を使おうとして挫折した頃のことを考えると,形態素解析の力でさくさくと生素材を提供してくれるこのソフトは神!!ですね。
KH Coderのマニュアルやチュートリアルを読むと,多変量解析の機能も備えているようですが,ともかくデータテーブルを書き出して使い慣れたSPSSで多変量解析をする方向で進めています。
今日はKH Coderで自由記述データと戯れることで終始しました。実際に作業をし始めると,本を読んで何となく分かったつもりでも,やはり,こまごましたところでつまづきますね。
今回のような比較的小規模のデータから始めて,自由記述データの調理に慣れていきたいです。

*1:これを書くために検索したら,まだあったのに驚き!