プロレス統計

「プロレスの数字とプロレスする」をテーマにプロレスに関連する数字を調べ、まとめ、考えるブログです。

MENU

with2.net 人気ブログランキング、カテゴリ別解析:スポーツカテゴリ編

毎回記事末尾に着けているこのリンク、ご存じの方もいるかもしれませんがGoogleアドセンス等の広告ではなくwith2.netというサイトが主催している人気ブログランキングへのリンクバナーであります。
ランキングということでそのブログからランキングサイトへのアクセス数によってランクがついているのですが、リンク集的性質もあるためここからのアクセスが見込めるというのも参加する上でのメリットでもあります(弊ブログではそんなに比重は高くないですが)。
またこのランキングを眺めることで、いまプロレスブログ界隈でどういう話題が流行っているのかを見ることもできたりする意味で重宝していたりもします。

で、時々このランキングを見ていて気付くのはなんだかんだと言いつつ定期的に新規のプロレスブログが誕生しているらしいということ。
1年ほど前、手動で当時存在した119件のプロレスブログについて継続期間を集計したのですがどうやらその時点から10件ほど増えている模様。
最近だとカクトウログさんのブログで鈴木みのるが昨今増えつつあるプロレスブログに関して語っていたとの話がありましたけど、「なぜこうして増えているのか」については気になるところです。

今回はこの直接的理由についての考察、ではないですがその理由を調査するべくwith2.netのブログランキングのいくつかのカテゴリについて集計し比較することで、「プロレス」ジャンルが特異なのかどうかについて検証・解析したいと思います。

今回前置きがだいぶ長いので下記目次の「集計結果」以下からご覧ください。

以前のwith2.netブログランキングに関する集計結果

www.pwanalysis.com

www.pwanalysis.com

 

前置き

ブログランキングにおけるカテゴリ構造について

f:id:Rodyonsw:20190807000436p:plain

まず初めに今回集計するwith2.net人気ブログランキング(以下ブログランキング)の各カテゴリの構造について。
ブログランキングではまず初めに26のカテゴリ(エンターテインメント、ペット、スポーツなど)に分かれています。
その下には子カテゴリ(サブカテゴリ)が存在します、例えば「スポーツ」カテゴリ中には「野球」や「サッカー」、「フィギュアスケート」などの子カテゴリが存在します。
さらに一部の子カテゴリにはさらに細かい分別として孫カテゴリ(サブサブカテゴリ)が存在しているものがあります。
例えば「野球」子カテゴリ内には「プロ野球」や「高校野球」、はたまた「巨人」「阪神」といった団体別の孫カテゴリがあったり。
子カテゴリの中には孫カテゴリがないもの(「フィギュアスケート」や「陸上競技」など)もあります。
(孫カテゴリの一部にはさらに下層の曾孫カテゴリ(サブサブサブカテゴリ)があったりもしますが今回はとりあえず扱っていません。)

IN値/OUT値の仕組み

f:id:Rodyonsw:20190807022552p:plain

上記のランキングの順位を決めるのは主にINという値によっています。
これはブログに張られたブログランキングへのリンクをクリックし、該当するランキングのページに飛んだ際に+10される値になっています。
つまりこのブログランキングは「どれだけの読者がリンクをクリックしたのか」の指標なわけですね。
リンクの張り付けられた位置にもよりますが、もちろんブログへのアクセス者数が多いほどリンクをクリックする数も増えるはずであるため、間接的に「どれだけブログのPV数があるのか」の指標にもなります。

同様な数値としてOUT値がありますがこちらは逆に、ブログランキングのページ上のリンクをクリックし、ブログへ飛んだ際に+10される値になっています。
つまりは「このランキングをみた読者がどれだけ興味を持ち、アクセスしたか」の指標であり、どれだけ他のブログからINしたユーザーを引き付けられているかの数値です。

f:id:Rodyonsw:20190807022329p:plain

ここはややこしいところなので飛ばしてもいいんですけど、このブログランキングでは登録の際に登録カテゴリを5つまで登録し、それぞれの振り分け率を決めることができます。
この振り分け率はブログ上のリンクを踏んでランキングにアクセスした場合に発生する合計10ポイントのIN値を各カテゴリにどれだけ配分するのか、という設定であり。
上図のようにカテゴリ1,2という二つのカテゴリに登録し、割り振りが6:4であるブログの場合、
カテゴリ1へのリンクをクリックすると、当然カテゴリ1のランキングへアクセスしますが、IN値はカテゴリ1へ+6、カテゴリ2へ+4と振り分けられます。
一方でカテゴリ2へのリンクをクリックすると、カテゴリ2のランキングへアクセスし、同様にIN値はカテゴリ1へ+6、カテゴリ2へ+4と振り分けられます。

複数のカテゴリに登録すれば、ランキングでブログへのリンクを目にするユーザー数も増えるわけですが、その一方でIN値はカテゴリ数の分だけ分散し、ランキング上位を狙うことが難しくなる。
ランキングへのジャンプ時にはそのブログの順位周辺が表示され、おおよそIN値とOUT値には相関関係がある関係から
「IN値が分散してランキングが下位に」→「高IN値のブログからの読者の目に留まりにくい」→「結果としてOUT値が期待できない(読者の増加につながらない)」という問題もある感じはします。

集計したもの

というわけで今回は「スポーツ」カテゴリ以下の子・孫カテゴリのランキングについてすべてのブログについて週間IN値(W_IN)、月間IN値(M_IN)、週間OUT値(W_OUT)を集計しました(2019年8月2日時点のもの)。
手法としてはいつものごとくスクレイピングによるものですが、各カテゴリにはIDが振ってあり、それを変えることで各ランキングページにアクセスが可能、ランキング自体も表形式なのでスクレイピングは簡単でした。
一つ苦労した、というか躓いたのは1ページごとのスクレイピングの時間が短いために、次ページのスクレイピングをする前に2秒程度のスリープを挟まないとアクセス制限がかかったことでしたかね。
Webスクレイピングの基礎、というかマナーというかですけどもし自分でやる時は気を付けましょう。

 

集計結果

「スポーツ」カテゴリ全体値

まず「スポーツ」カテゴリ全体の数値ですが、
登録ブログ数は合計で5522件、W_INの合計値は57万7945ポイントで、平均は104ポイントでした。
また、W_IN値が0となっていたブログの件数は4884件実に全体の88%にも及びます。
M_IN値で見るとM_IN=0だったのは2684件で全体の48%、これでも半分近くが1か月近くリンクのクリックがない状況にあるようです。
勿論「登録だけしたけどリンクを張るのをやめた」というケースもあるんでしょうけど、思った以上にあまり活用されていないという感じはします。
はたしてこれが「スポーツ」カテゴリ特有の数値なのかはまた後日別カテゴリでの調査で調べたいところです。

ブログ数順位

f:id:Rodyonsw:20190808183023p:plain

さてまず初めに各子カテゴリに所属するブログ数(num)について。
上の票は登録ブログ数の多いカテゴリの上位10個ですが、流石に日本における2大メジャージャンルともいえる野球、サッカーは強い。
と思っていたんですがそれに次ぐ数なのが格闘技ジャンルということは結構驚きだったりします。
以下でサブカテゴリについても話しますが、こと野球・サッカーについてはプロ・アマの別があったり各団体についても孫カテゴリが存在するので多いのは道理なんですけど格闘技がここまで多いのはそういう意味では意外ですらあります。

f:id:Rodyonsw:20190808183049p:plain

続いては各孫カテゴリごとの登録されているブログ数のトップ10。
ちなみに孫カテゴリの登録がないものについては除外しています。
ここではトップ5中の4つがサッカー関係(日本代表はサッカーの子カテゴリ内のみに存在)、そこにプロ野球(団体別サブカテゴリもあるので全般についてのブログ?)が存在する感じですね。
で注目すべきは6位に入った空手、こちら132件もあるんですねぇ、その界隈の情報がないから以外ですらある。
そしてそこに次ぐのが弊ブログも所属するプロレスカテゴリですね。

こうしてみると子カテゴリを見てみると、自分がやるスポーツ・いわゆる競技人口が多そうなジャンルが盛況に見え、子カテゴリを見ると自分が見る方のスポーツ・プロスポーツに関するカテゴリが盛況な感じもします(それは集計の仕方もあるんでしょうけど)。

W_IN値順位

f:id:Rodyonsw:20190808185118p:plain

続いては各子カテゴリに所属するブログの平均W_IN値(W_INav)の上位10件、参考としてブログ数(num)、合計W_IN値(W_IN)も載せています。
正直言うとここが今回の集計で一番驚いたところでなんと他の子カテゴリが平均数十ポイントな一方でフィギュアスケートのみが二桁違いの平均1926ポイント
以前ちらりとスポーツカテゴリの上位ブログを見てみたんですけどなんと上位24件がすべてフィギュアスケートジャンル、というか羽生結弦選手のファンブログが占めているんですよね、その時の「おぉ…マジか…」という気分と言ったら(ちなみに25番目にはプロレスジャンルのトペスイシーダプロレスブログが入っています、すげぇ)

f:id:Rodyonsw:20190806235401p:plain

このフィギュアスケートジャンルの特異点っぷりは上の図、横軸にジャンルのブログ数、縦軸にW_IN値をとった両対数グラフでも明らかで、
ほとんどのジャンルがブログ数とW_IN値に相関関係があり、一直線をなしているのに対してフィギュアスケートのみがその直線状から大きく外れています。
この理由については定かではありませんが、フィギュアスケートジャンルはかなり特殊なジャンルということが言えるかもしれません。

f:id:Rodyonsw:20190808185134p:plain

では本題ともいえる孫カテゴリにおける平均W_IN値のトップ10です。
先ほどの氷上銀盤特異点:フィギュアスケェトを見た後だとインパクトが薄いかもですが、孫カテゴリの中だとプロレスジャンルが2位に二倍近い数値、平均193ポイントを記録しています。
といいつつこの中でいうとプレミアリーグの93ポイントや広島東洋カープの92ポイントも添え以下を大きく引きはがしている数値なんですけど、それらと比較してもかなり高い平均W_IN値を持っているようです。

ちなみに同様にブログランキングに定義されているOUT値に関してはINとおおよその相関関係にあるようで、「INが高ければOUTも高い」と考えても大丈夫と思います。

W_IN値なしブログ率

続いて少し特殊な解析として、各子カテゴリに登録されたブログの内W_IN値が0だったブログの数(zero)、そしてブログ数に対する割合(zero%)を調べました。
例えば10個のブログがあって9個がINが0、1つが1000であれば平均値は100になるので実態の印象とは変わったりもするのでこちらも併せることでより実態を見ることができるとも。
ちなみにここではブログ数が10件以上のカテゴリのみを集計しています、あしからず。

f:id:Rodyonsw:20190808190912p:plain

でその子カテゴリでの結果が上の図ですがここでもフィギュアスケートジャンルが頭一つ低い27%を記録していますね。
そしてランキングとしても平均W_IN値と打って変わって野球やサッカーといったプロスポーツがランクインせず、マラソンや筋力トレーニングといった自分でやるスポーツジャンルの方が上位に来ています。
そう考えるとなおさらフィギュアスケートの特異点っぷりが際立つとも言えますが・・・

f:id:Rodyonsw:20190808190856p:plain

続いては孫カテゴリですが、こちらでもプロレスジャンルは31%とかなり低い値で1位になっています。
それに次ぐ2~4位がサッカー関係なあたりサッカー関係のほうがW_IN値は生じやすい傾向はあるんですかね。

 

所感雑感

というわけでいつぞやぶりのブログランキングに関する解析でした。
本当はもう一度ブログの開始時期とかを調べようかと思ったんですけど、如何せん「そのページがいつ作られたのか?」ってプログラミングで調べるの難しいんですよね、かといって今更手動でやりたくないし。
しかし結果としてプロレスの特異性を調べようと思ったらさらに特異なジャンル(フィギュアスケート)を見つける羽目になるというオチになりましたが、そういうイレギュラーもまぁよいでしょう。

まぁ本題に戻るとプロレスジャンルはスポーツジャンル全体を見ても「平均W_IN値が高い(=W_OUTも高いはず)」「W_INが0の割合が低い」という特徴があるようで、これはすなわちランキングへの流入が盛んに行われている、つまりそこからのブログへの流入も見込めるジャンルであるということが言えるとも思います。
そういうことを考えると、検索流入などが見込めない初期のブログが積極的に登録することで比較的容易にPV数を稼ぐことができるという特徴があるかもしれません。
まぁそういうことを言い出すと一番のおすすめはフィギュアスケートジャンルなんですけども、何となくこういう特徴があるからこそ最近新規ブログも増えているのかなぁと思ったりもします。

冒頭で述べたように「なぜそういう特徴があるのか」はわかりませんが、それについてはまた後日考え、検証したいなぁと。

きょうはこれまで、それでは