lionusの日記(旧はてなダイアリー)

「lionusの日記」http://d.hatena.ne.jp/lionus/としてかつてはてなダイアリーにあった記事を移転したものです。

図解 よくわかるデータマイニング (B&Tブックス)/数式を使わないデータマイニング入門 隠れた法則を発見する(データマイニングの入門書2冊。)

ずっと放りっぱなしのデータを分析しなおそうと妄想構想していますが,その前にもう一度データマイニングについて確認しなおそうと,OPACで検索して気になったもので借り出せるものを借り読みはじめました。
今日読んだのは以下2冊。

図解 よくわかるデータマイニング (B&Tブックス)

図解 よくわかるデータマイニング (B&Tブックス)

広く浅くデータマイニングに関係する事柄について,ほぼ全方向的におさえてあります。
すごい。
そのため,ひとつひとつについての記述は簡潔過ぎなのですが,(自分としてはある程度わきまえている分野の)統計解析についての章を読んでの印象からは,簡にして要を得ているのではないかと感じました。
データマイニングそのものではないが,データマイニング環境を整えるために使う,プログラミング言語についての記述がツボりました。
(初心者のためのプログラミング征服アドバイス・要約抜粋)

  1. まずPerl;とっつきやすく初心者向き
  2. C言語を文法だけでも少しかじる;深入りはしない
  3. JavaJavaC言語の上位互換;Java独特のオブジェクト指向
  4. Rubyオブジェクト指向言語Perlと似たような文法

以上4つをかじれば大体の言語に対応可能?
大抵の仕事はPerlJavaで対応できる

私はPerlRubyはかじったこともないし,CとJavaは一口かじりかけたのみなので,何とも判断できませんが,情報科学分野ではない人(著者はバイオ系)から見た意見として,面白かったです。

数式を使わないデータマイニング入門 隠れた法則を発見する (光文社新書)

数式を使わないデータマイニング入門 隠れた法則を発見する (光文社新書)

さらっと読めます。本当に数式は出てきません。(実際のデータを元にしていない)例え話により,データマイニングで使う各種統計解析手法について説明されています。
ただ,一見とても分かりやすく,確かに分かったような気分になるけれども,本当に腑に落ちて使える知識になるかどうかはちょっと疑問な気もしたり。でも,新書としては丁度よい加減だと思いました。
最後から2つの章は,「第10章 データマイニングと情報管理」「第11章 監視社会とデータマイニング」と,データマイニングそのものではなく,情報マネジメントぽい話になってきて,どうも著者のご専門が色濃く出た話に飛んでいます。自分はこの方面にも興味があるので,ふむふむと思いながら読みましたが,データマイニングって何?と情報を求めて読む人は,読み飛ばしてしまう内容かもしれませんね。