新学期も始まって2週間も経った昨今皆様いかがお過ごしでしょうか。
春のアニメも一通り出揃って、見た中だとひそねとまそたんが気になりましたかね、いやどうやってこんな設定考えたんや・・・
それはさておき先週こんな記事を書きました。
prowrestlinganalysis.hatenablog.com
まぁオカダさんのコメントを踏まえて実際に後楽園の動員データを調べてみたってヤツです。
ここでは一部をみて「一月の大会数が多いと動員が減る」んではないかという結論を出しはしましたけどちゃんとした解析と言うには程遠かったので今回はsklearnを用いた単回帰分析とかを使ってちゃんと調べてみました。
集計設定
今回用いたデータは新日本公式サイトの試合結果ページにおいて「東京・後楽園ホール」で行われた「2016年1月~2018年3月」の期間に行われた大会のデータを用いています。
ちなみにこの期間中に後楽園ホールを用いた会社説明会もあったんですが、そのデータについては省いていますのであしからず。
大会数依存性
まず始めに前後1ヶ月の大会数別に各大会の動員をそろぞれプロットしたものが上の図、青い半透明の丸が各大会ですね。
これらのデータから単回帰分析で動員数の大会数依存性を示したのが青い点線。
単回帰分析では目的の数値(今回は大会の動員)が説明変数(今回は前後1ヶ月の大会数)で説明でき
(大会動員数)=A*(大会数)+B
といった数式で表せると仮定した場合のこのAとBの係数をそれぞれ見積もるわけですが、
今回の大会数依存性ではこのAの値が-49.83と見積もられました。
言ってみれば「一ヶ月の後楽園大会数が1大会増えると観客動員が50人減る」という傾向がある、ということですね。
ついでに同じ後楽園大会のデータで、各大会数での平均値をプロットしたのがこちら。
この平均値をみてもほぼ線形的に減少しているのが見えますね。
このことから、やっぱり「1ヶ月以内の大会数が増えることで観客動員に減少傾向がある」ことは言えるかと思います。
曜日依存性
次に、各曜日別にデータを集計してみたのがこちら。
こちらに関しては単回帰分析はせず平均値(赤)をプロットしています。
ちなみに大会数は月~日で11、8、3、6、21、13、11大会となっていました、意外に金曜日開催の大会が多いんですね、それに土日月が続く形。
それはさておき平均値を見ると大体の傾向として土日>平日の傾向がある、とおもいきや何故か木曜日の動員も結構良いんですよね。
これについては個別のデータを見たほうがいい気もしますけど謎だなぁ・・・
木曜日に関しては動員が特別落ち込んたことがないのもこの高い平均値に影響しているとは思います。
バラつきという点では木曜日意外でいうとやはり土日は安定して動員が多い大会が多いですね。
で、今度は「平日か休日か」でデータを二分割してみたデータがこちら。
横軸の数値が0なら休日(土日)、1なら平日(月~金、祝日などは考えず)というふうにしてあります。
こうして見ると休日はバラつきが非常に小さく、動員数も高い数値で固まっているのに対して、平日の場合はかなりばらついているのがわかりますね。
そして単回帰分析の結果は依存性はー77.69、平均として平日の大会は80人程度動員が減るって感じでしょうか。
参戦レスラー人数依存性
次に参戦レスラーの人数による依存性。
これに関しては比例定数が2.67、つまり「レスラー一人当たりに平均2.67人の集客力がある」みたいなこともいえるのか?とも思いましたけど、分布を見ると単調減少・増加って感じでもないのでちょっと言いすぎですかね。
ちなみにこの回帰分析での切片(説明関数=0の時の値)が1525だったので「選手とかによらない新日本という団体自体の集客力」としてみることも・・・と言うのもいいすぎですね、こういうのが選手数に線型依存するかわからんですし。
いずれにしろ回帰分析ではわかりづらいので各選手数での平均値を取るとこんな感じに。
大会数的には選手数が25~40人の大会が多いって感じですが、分布がばらつくのもこの辺りで、逆にそれ以外の人数が少なかったり多かったりって範囲の方が平均動員数は高めですね。
これは人数が少ない=G1やBOSJなどのシングルリーグ戦だから良いカードが多いってことで動員が増えているのかも。
トップ選手依存性
これが今回のメインの結果になります。
内容としては所謂トップ選手、ここでは棚橋、オカダ、内藤、ケニー、鈴木みのるの5選手を新日本でのトップ5選手、BIG5と定義し、各人の参戦(=1)負参戦(=0)で回帰分析を行ってみたものです。
結果としてはいずれの選手についても観客動員に対して正の依存性が見られました、つまりは「BIG5の選手が参加することで観客動員は向上する=客が呼べる」傾向があるってことですかね。
比例係数 | 大会数 | 平均動員 | ||
棚橋 | 74.47 | OUT | 18 | 1559.3 |
IN | 55 | 1633.8 | ||
オカダ | 95.18 | OUT | 10 | 1533.3 |
IN | 63 | 1628.5 | ||
内藤 | 128.95 | OUT | 7 | 1498.9 |
IN | 66 | 1627.8 | ||
ケニー | 75.45 | OUT | 36 | 1577.2 |
IN | 37 | 1652.6 | ||
鈴木 | 32.71 | OUT | 40 | 1600.6 |
IN | 33 | 1633.4 |
上の表は各回帰分析での比例係数と参加しなかった大会数(OUT)と参加した大会数(IN)及びそれぞれの平均動員数になっています。
この比例係数はまぁ言ってみれば「どの程度観客動員に影響するのか」って感じですかね。
結果を見ると一番大きい係数になったのは内藤さんで128.95、続いてオカダさんが95.18、それに棚橋ケニー(75程度)、そして鈴木が32と続く感じ。
こういう数値で見ると「BIG5の内誰かがいないことで観客動員に影響が出る」という直感もある意味では当たっているかもしれませんね。
とはいえここのデータで言うと鈴木は2017年から新日本リターンで、2016年は丸々参戦していないわけですから、それによって不当に数値が低く見積もられている可能性はあります。
BIG5出場数 | 大会数 | 平均動員 |
0 | 2 | 1677.5 |
1 | 8 | 1499.75 |
2 | 3 | 1401 |
3 | 13 | 1608.08 |
4 | 34 | 1635.65 |
5 | 13 | 1682.62 |
また右下の紫色のグラフにはBIG5が何人参戦したか、の依存性を見ていますがこちらの回帰分析では係数は32.71となっており、BIG5一人当たりに33人程度の集客力が・・・というのはちょっと上のデータと矛盾するかも。
いずれにしろBIG5の人数が増えることで観客動員が増加する傾向にあるのは確かなようです。
なのですが、その一方で同様のデータを平均値を取ってみると上の図のようになります。
ご覧の通りBIG5の人数が0~2人の間では逆に人数が増えることで動員が減っているんですよね。
その一方で3人以上になると平均値的には観客動員が上昇しているのでここはなんとなく直感には沿うのですが・・・謎が増えてしまった・・・
所感雑感
というわけで以前行った解析”もどき”を進めてちゃんと解析してみました。
とはいえ如何せんこういう回帰分析をするのが初めてだったのでいろいろと怪しい部分が残ったどころか増えてしまいましたね・・・
タイトルに"単回帰分析"と入れたのは、本来は複数の説明関数を用いて行う「重」回帰分析というのがあって、そちらの方が実際に色々な要素が影響しあっているであろう観客動員をちゃんと解析できるんでは、と思っていたんですがちょっとまだ出来ていないので今回はとりあえずの解析結果として記事にしました。
まぁ結果として直感に沿った傾向が現れはしたんですが、逆に前回の記事で主張したことを否定してない?と思ったりもして解析しながらもにょっておりました。
とはいえこれもまた一つの解析結果ではあるので、これを参考にしていただけると幸いです。
きょうはこれまで、それでは