lionusの日記(旧はてなダイアリー)

「lionusの日記」http://d.hatena.ne.jp/lionus/としてかつてはてなダイアリーにあった記事を移転したものです。

酒税データ分析その3。

人口補正した酒類消費量プロフィールにより,都道府県をクラスタ分析により分類することは大体うまくいったぽいので,今度は酒類(人口補正値)を主成分分析により次元分解してみることにしました。
その次元分解した後の酒類消費量プロフィールによる都道府県のクラスタ分析結果と,先のクラスタ分析結果がどれだけ一致するかな?と試してみたくなったのです。
さて主成分分析(固有値1以上,回転なし)でおこなったところ,みりんや甘味果実酒の共通性が低いようなので,この2つの変数を抜いてまた色々試してみました。けれども,因子を抽出したいのではなく,とりあえず次元分解というか情報圧縮してみたいだけなので,じゃあまたみりんも甘味果実酒も入れてみようか,と2因子(スクリープロットの様子などから),回転なしの主成分分析をおこない,成分プロットしてみた結果が下図です。

やっぱりみりんと甘味果実酒は2成分では捉えきれないというか,仲間外れっぽいかな〜
ざっくりと,第1象限がビール,リキュール,原料用アルコール・スピリッツ,果実酒,ぎりぎりブランデーで,ビール&洋酒系の感じ。
第2象限が発泡酒,単式蒸留しょうちゅう(乙類,本格焼酎系)。
第4象限が清酒合成清酒,連続式蒸留しょうちゅう,ぎりぎりウイスキーで,日本酒+アルコール度数の高いお酒な感じ。
軸の解釈は・・・また続く・・・