さて今回は簡単な補足解析になります。
というのも先日with2.netが主催・集計している人気ブログランキングについて以下の記事のようにまとめました。
まぁ単純な件数もあって集計していくつかグラフを作っただけでもう疲れちゃってたわけですが、その後更なる解析を一つ思いついたのでその結果だけご報告です。
W_OUTのW_IN依存性
他のブログランキングについてはよくわからないですけど、with2.netのランキングではINとOUTという数値が定義されており、このうち1週間のINの合計値によってそのランキングの順位が決定されています。
INはブログに貼られたリンクを介してランキングにどれだけアクセスがあったのかを示す数値、OUTは逆にランキングからブログへアクセスした数値になっています。
ブログに設置されたリンクのクリック率を一定とした場合PV数が多いほどこのIN値は上がることからこのIN値を”人気”として定義しているわけです。
前回集計した結果ではこのIN及びOUTの週間値(W_IN、W_OUT)の分布について、いずれも偏りのある分布があることがわかっていました。
で、今回はこのW_INとW_OUTの関係性・依存性について調べてみたわけです。
上図はその集計結果、縦軸がW_OUT、横軸がW_INの値になっており青いプロットが各ブログ(ただし両方とも0以上の数値のもののみをプロット)ですね。
今回はプロットを両対数グラフで表示しているのですが、これを用いることで数値に大きなばらつきがあるデータをまとめるのが簡単になり、また大まかな依存性も調べることができます。
このデータについてフィッティングを撮ったのが赤い点線で、依存性としてはグラフ中にも書いてあるように
W_OUT = 4.4251 × W_IN^1.0978
という依存性があることがわかりました、単純な比例よりもちょっと次数が大きいというあたり、W_INが大きくなるほどW_OUTが単純な比例よりも増えていくってことですね。
近似線とプロットの傾向もよく合っているのでそれだけで何となく満足です、これが何に役立つのかはさておき。
おまけ
軸を通常の軸に直したもの、こうしてみると大きく傾向から外れたものもあるように見える不思議。
所感雑感
というわけで簡単にですが補足解析、補稿でした。
いつもと比べても短めですけどいつもよりも統計解析っぽいことができてそれはそれで満足なのです、前回まとめた時に解析できてればなおよかったんですけども。
きょうはこれまで、それでは