さて、本日からついに開幕する新日本プロレス”ジュニアの祭典”Best of the Super Jr.(以下BOSJ)、皆様の準備はいかがでしょうか。
昨日にはいつもG1 CLIMAX(夏に行われる新日本プロレスのヘビー級のシングルリーグ戦、以下G1)の公開記者会見が行われる会場でBOSJの前日記者会見が行われていましたが、
こういった演出でも「ジュニアヘビー級はヘビー級の下じゃない!」という主張にも見えますね。
ちなみに昨年は後楽園ホールで前日記者会見が行われてましたね、あれもあれで雰囲気があって自分は好きなんですけども。
それはさておき、先日当ブログでは各種数値を用いてBOSJの優勝者予想をおこなった(↑記事)のですが
その後、夏のG1に向けてプログラムを改良し改訂版が完成しました。
本来は完成しただけで記事にはしないんですが、その結果優勝予想が変わってしまったのでそれも含めて、変更点とその結果についてご報告です。
2つの変更点
今回の計算方法は、ほとんど前回の方法と同じではありますが以下の2つの変更点があります
1.2012~2018年までの6年半のデータを使用
前回の場合は簡単に計算するために2017年と2018年のデータのみを用いていましたが、
今回は2012~2018年の過去6年半分のデータ、しかも各年のBOSJに参加した全選手のデータを用いて計算しました。
これによってより正確性の高い予測が可能になったのではと考えています。
2.前年度のBOSJと今年度BOSJの変化に注目
以前の計算では単純に前回のBOSJ~次のBOSJの間のデータを集計し、その数値と次のBOSJでの勝率の関連性を調べました。
今回はそれに加えて前年度のBOSJでの成績も集計し、前年度の成績と今年度の成績の変化に注目して解析をしました。
つまりは「前年度のBOSJから1年間の成果が翌年のBOSJの成績に出るんじゃないか?」って言う感じですね。
というわけでこれらの変更点を踏まえて予測していきましょう。
集計した8つの要素
今回の集計では、上でも述べたように各年度・各選手の
○前年度のBOSJでの勝率
○今年度のBOSJでの勝率
◆一年間のシングル戦の勝率
◆一年間の全試合の勝率
◆一年間の試合数
◆一年間の平均試合順(各大会で第何試合に出場したか、の平均)
◆シングル戦数
◆平均試合時間
を集計しました。
で、今回は○印二つの要素の変化を他の数値を用いて説明する、多重回帰分析の手法を用いています。
多重回帰分析は被説明関数(後述)がいくつかの説明関数(◆印のついたもの)の組み合わせで求めることが出来る、と仮定した上で
各説明関数がどの程度被説明関数に影響を及ぼすのか、を調べる手法です。
3種類の比較法
というわけで今回は前年度と今年度のBOSJでの勝率を比較するのですが、比較するにしてもいくつか方法があるので今回は被説明関数として
- 今年度のBOSJの勝率のみ
- 今年度と前年度の勝率の差
- 今年度と前年度の勝率の比
の三種類をもちいて、それぞれについて回帰分析を行いました。
一番上は前回やった分析とほぼほぼ同じものですかね。
単回帰分析編
マズ初めに上記の説明関数それぞれの、単体の影響を見るために単回帰分析を行いました。
ちなみに以下の図では
◆一年間のシングル戦の勝率=Swinrate
◆一年間の全試合の勝率=Twinrate
◆一年間の試合数=match
◆一年間の平均試合順=order
◆シングル戦数=single
◆平均試合時間=time
とラベル付けしてあります。
被説明関数=”BOSJ勝率”の場合
各グラフにプロットしてあるのは各年のBOSJの勝率で、縦軸がその数値、横軸は各説明関数の数値を示しています。
点線はこの分布に最も近い直線を示しています。
ぱっとみるとどのグラフを見ても完全に点線に一致するような分布はほとんどなく、そこから外れるようなデータもおおいのですが、
その中で言うと全試合勝率(Twinrate、上段真ん中)と試合時間(time、右下)はかなり綺麗な依存性が見えている感じはしますね。
このことから考えると「総合的な勝率が高く」「試合時間が長い」選手ほどBOSJで勝率が良いという傾向がある感じですかね。
以下は各説明関数に対する影響度(係数)をまとめたもの。
ほとんどの数値には正の相関(数値が増えるほど勝率が高い)がある一方で、
試合数についてのみ負の相関(試合数が増えるほど勝率が低い)が見えていますね。
説明関数 | 影響度 |
シングル勝率 | 0.12 |
全試合勝率 | 0.68 |
試合数 | -0.05 |
平均試合順 | 5.23 |
シングル戦数 | 1.63 |
平均試合時間 | 0.1 |
被説明関数=”勝率の差”の場合
次に被説明関数を前年度と今年度の勝率の差とした場合の各単回帰分析の結果になります。
差で見てみるとBOSJでの勝率単体で見たときよりもはっきりとした依存性は見えづらいですね。
傾向としては今年度のBOSJの勝率のみを被説明関数とした時と同じように、各要素に正の相関、試合数にのみ負の相関があります。
説明関数 | 影響度 |
シングル勝率 | 0.11 |
全試合勝率 | 0.16 |
試合数 | -0.01 |
平均試合順 | 1.35 |
シングル戦数 | 0.62 |
平均試合時間 | 0.05 |
被説明関数=”勝率の比”の場合
次は被説明関数を前年度と今年度の比にしたもの。
比なので他の二つの場合と比較して縦軸の数値及び係数も小さくなっています。
説明関数 | 影響度 |
シングル勝率 | 0.002 |
全試合勝率 | 0.002 |
試合数 | -0.0002 |
平均試合順 | -0.0002 |
シングル戦数 | 0.015 |
平均試合時間 | 0.0007 |
”勝利指数”比較
ということで、これらのデータを用いて多重回帰分析を上記の3つの被説明関数において行いました。
これについては余り難しいことを述べても・・・なので、多重回帰分析から得られた係数から、今年2018年のBOSJに参戦する選手について予想される勝率、"勝利指数"を計算してみました。
ここでは単純に各選手について、各要素とその影響度を掛け合わせた数値を足し合わせたものを"勝利指数"としています。
さてその結果は・・・
"勝率"Ver
名前 | 勝利指数 |
---|---|
マーティー・スカル | 98.48 |
ウィル・オスプレイ | 84.9 |
KUSHIDA | 82.15 |
高橋 ヒロム | 73.86 |
BUSHI | 73.78 |
田口 隆祐 | 70.17 |
エル・デスペラード | 69.5 |
YOH | 69.09 |
SHO | 69.09 |
ACH | 68.98 |
ドラゴン・リー | 68.32 |
金丸 義信 | 59.19 |
タイガーマスク | 54.48 |
”勝率の差”Ver
名前 | 勝利指数 |
---|---|
マーティー・スカル | 123.6 |
ウィル・オスプレイ | 121.17 |
KUSHIDA | 118.38 |
田口 隆祐 | 110.18 |
ドラゴン・リー | 103.0 |
BUSHI | 102.56 |
高橋 ヒロム | 101.7 |
金丸 義信 | 95.79 |
ACH | 88.19 |
エル・デスペラード | 87.08 |
タイガーマスク | 75.48 |
YOH | 41.8 |
SHO | 41.8 |
”勝率の比”Ver
名前 | 勝利指数 |
---|---|
マーティー・スカル | 58.91 |
KUSHIDA | 52.9 |
ウィル・オスプレイ | 51.99 |
田口 隆祐 | 43.83 |
ドラゴン・リー | 39.14 |
ACH | 30.13 |
BUSHI | 29.57 |
高橋 ヒロム | 27.77 |
金丸 義信 | 27.05 |
エル・デスペラード | 25.81 |
タイガーマスク | 17.97 |
YOH | 0.0 |
SHO | 0.0 |
3種類の計算方法全てでマーティ・スカルが1位!
前回の、2017年と2018年のデータのみを用いた場合はウィル・オスプレイが1位でしたが、その時とは大きく変わってしまいましたね・・・
ちなみに3種類の計算全てでトップ3(マーティ、オスプレイ、KUSHIDA)は一致しているのでなんというか安心。
所感雑感
というわけで「まぁ多少プログラムを変えても同じ結果が出るやろ!」と高をくくっていたら全然違う結果がでてたまげた、という話でした。
簡単に言えばデータの量を増やしたら傾向が変わったってことなんですけど、多分今回の方が正しい、はず。
奇しくも昨日行われた記者会見ではフライトの遅れで欠席かと思われたところに何とか間に合い、熱いジュニア愛溢れる名スピーチでジュニアファンのハートをがっちり掴んだところですから、これはその後押しも受けて優勝もワンチャン・・・
ちなみにLINEで行われた優勝者予想アンケートでは第9位、なんでや