酒税データ分析その2。
昨日,人口数による補正をした酒税データでクラスタ分析を行った後,補正していないそのままの消費量でクラスタ分析したらどうなるかな?と思い,Ward法,値の標準化なしでやってみました。
ここでも東京は単独クラスタ,その他は神奈川,愛知,大阪クラスタと,北海道,埼玉,千葉,兵庫,福岡クラスタ,他その他大勢クラスタに分かれるようにも見えました。ただ,神奈川〜クラスタと北海道〜クラスタはまとめてもいいかな〜という感じです。
デンドログラムと各クラスタの所属ケースを見ていると,これは,全酒類の中で最も消費量の多いビールが大きく影響しているのではないか?要するに,これはビール消費量によって分類されているのでは?と思ったので,ビール消費量の多い順に棒グラフを描いてみました。
案の定,ビールの大消費地とそれ以外,を分類するクラスタ分析(笑)となっているようでした。
東京や大阪,愛知(名古屋),福岡といった大都市圏を含む都道府県がその他大勢クラスタでないのは納得できるのですが,その中で北海道はビールを頑張っている(?)のですね。さすがサッポロビールの本場です。サッポロビールを飲みながらジンギスカンを食べてみたくなりました*1。