【おみくじの】遊びで統計をしてみた。【神社ごとの傾向を分析】

注意(attention)

予め言っておきますが、私の完全なお遊びで分析を行っているため、変数に主観的なものを含んでおり、統計の結果の意味は全くと言っていいほどありませんので、そのところご了承ください。

おみくじをやってきました。

新春恒例のおみくじをしてきました。今回は3つの神社で引いてきました。多分人生で一番おみくじを引いた年になったと思います。今回は神社ごとの運勢の傾向性を確かめるために、Rを使ってクラスタ分析を行います。

用いたデータは下記の通り

・n=3(1:橿原神宮、2:大神神社、3:大阪天満宮)

・変数:(縁結び、恋愛、学業等)18種類(なお、コメントがなかった神社については、欠損値としております)

・5件法(1=悪いコメントしかない、2=総合して悪いコメント、3=普通(あるいは良し悪しが同じ程度)、4=総じて良いコメント、5=良いコメント) (方角のみ今回は四方のみであったため、North,East,West,Southの名義尺度になっております)(運勢は大吉:5、中吉:4、吉:3、末吉:2、凶:1)としています。

分析してみた

まず、LibreOffice CalcでまとめたデータをクリップボードにコピーしてデータをRに読み込ませます。

dat <- read.table("clipboard", header = TRUE)

その後、クラスタ分析(ユークリッド距離、最長一致法)をかけていきます。

result <-hclust(dist(dat[,-18]),method = "complete")

しかし、この分析を掛けた時点で欠損値が省かれるので、変数が7つ(いずれの神社においても欠損値がないもの)まで落ちました。(運勢、願事、学業、縁談、結婚、旅行、方角)

そして、先ほどの分析結果を、デンドログラムに出力します。

plot(result, hang = -1)

hang = -1にすることによって、デンドログラムを一番下まで線を伸ばすことができます。

そうして出来たグラフが下記のとおりとなります。

f:id:rakugou:20150111165308p:plain

ちなみに、Ward法で行ったものは下記のとおりとなっております(クラスタ分析の"complete"を"ward"に変えると可能です)。

f:id:rakugou:20150111165342p:plain

結果

どこでクラスタ数を区切るかは目分量ですが、最長一致法では大神神社大阪天満宮がちょっとだけ近くて、橿原神宮だけ独立、もしくは、3つの神社もほぼ独立なんでねぇの?って結果が出てきました。ちなみに、Ward法でやっても結果はほぼ同じでした。結果はまちまちなので、本当に今年の運勢を占うというのであれば、どこか一つで引いておけば十分なんじゃないかなぁと思います。むしろ、おみくじを複数回引くという事自体がまれなんじゃないかなぁ。神社数を増やしてみたり、複数人集めて調査したりすると楽しそうですが、前者は金銭的な問題で意味を感じなさそうですし、後者はバカバカしくて人が集まらないことうけあいですし、私の人望もありませんで難しいでしょう。