lionusの日記(旧はてなダイアリー)

「lionusの日記」http://d.hatena.ne.jp/lionus/としてかつてはてなダイアリーにあった記事を移転したものです。

ひねくれ者なのでちょっと違ったことをしたい。

非常勤先のひとつで,Excelのちょっと進んだ内容をするクラスを新たに担当させていただくことになったので,慌てて教材を作っています。
その中で,Excelのピボットテーブルについて,テキストにある内容ではちょっと分量不足なので何かを追加しようと考え,そのヒント探しにぐぐってみたりしましたが,何かの売り上げデータみたいなのが多いようですね。
確かに,それはそれでよいのですが,lionus的にはピボットテーブル=一種のクロス集計と思っているので,もっと広くネタを考えられないかと考えて辿り着いたのが,野球選手のデータです。
http://bis.npb.or.jp/players/
このページから,各球団の支配下選手のページに入り,HTMLファイルで一旦保存してからExcelで開き,セ・リーグ全球団の選手データをExcel上にテーブルとして保存しました。
そして,ピボットテーブルで,例えば球団×ポジション別の人数を出してみたり,球団×投手の右投げ・左投げの人数を出してみたりという例題を作ってみました。
だから特にどうということはないのですが,例えば,ポジション別に身長と体重の平均を集計すると(検定はしてないので有意差はないかもしれないけど),投手は他ポジションよりも身長が高く体重もやや重い傾向にあり,一方,捕手は身長はそこそこだが体重がちょっと重たいなど,まあ素朴直感の範囲内の結果が出ていたのが面白かったです。
あと,まだ試していなのですが,選手個人成績はかなり詳細に掲載されているので,これを多変量解析してみたら綺麗なタイプ分け結果が出るのではないかな〜と思ったりもしました。気が向いたときにちょっと試してみたいです(ま〜誰か他の先生がすでにネタとしてデータ解析の授業なんかでされていたりいるとは思いますが)。