プロレス統計

「プロレスの数字とプロレスする」をテーマにプロレスに関連する数字を調べ、まとめ、考えるブログです。

MENU

WordCloudで見る「内藤哲也、かく語りき」

プロレスとその他の格闘技・スポーツの大きな違いとして挙げられる要素がリング内外での「言葉」を重要視、または有効活用するということがあります。
プロレスラーはその言葉によって観客を扇動し、またファンは言葉を使って試合を解釈し、そうしてプロレスには独自の物語性が生まれていくわけです。

とはいえそういう言葉、文章の解析はなかなか難しいので弊ブログではこれまであまりまじめにやってこなかった*1んですが、今回はPythonでWordCloudを作成するモジュールを発見したのでそれを用いて表題の通り最近の内藤哲也選手のインタビューについて解析をしていきたいと思います。

参考:【備忘録】日本語のワードクラウドを作る - Qiita

 

WordCloudとは

まずはじめにWordCloudとはなんぞや?という話なんですが、ある文章中において出現頻度の高い単語を、その頻度に応じた大きさで図字する手法で、そのサイズを比較することでどんなワードが繰り返されていたのか≒何を強調しようとしていたのか?ということが分かる図です。
以前の解析で使った共起ネットワークは単語の登場頻度に加えて「どの単語と一緒に使われていたのか」を単語同士の近さでも表していたんですが、WordCloudではその情報は入っていないので単純に出現頻度だけのデータというのはお気を付けください(近くにある単語であっても関連性は別に高くない)。

集計したもの

今回はやはりある程度の文章量があるもの、かつ一問一答形式のインタビューでないものの方がより選手の意見・言いたいことが出るかなぁと思ったので、直近で行われた内藤さんの一夜明け会見をスクレイピングで取得。
一夜明け会見は全文が無料公開されているのもあってスクレイピングもしやすいですしね。
で、取得したのは1月7日に行われた1.4&1.5東京ドームの一夜明け会見*22月10日に行われた2.9大阪城ホールの一夜明け会見*3の二つ。
両会見ともに内藤さん以外の発言者もいますがそこはスクレイピングで除外して、内藤さんの発言のみに関して以下の解析をしています。

WordCloud解析結果

1.7 ドーム一夜明け会見

f:id:Rodyonsw:20200321013704p:plain

まず初めに1.7の一夜明け会見に関する解析結果のWordCloudがこちら。
最も大きく表れているワードは「お客様」、今会見の一つの焦点がメイン終了後のKENTA選手の襲撃でもあったのでそれに関して「お客様」の気持ちが・・・ということを2パラグラフに渡って苦言を呈していたので、この会見の一つのテーマと言えるでしょう。
まぁ内藤さんに関しては2015年のLIJ結束時から(場合によっては嫌味も込めてたけど)この「お客様」というワードを駆使していたので、ある意味でLIJの内藤哲也としての原点回帰ともなるインタビューだったかな、と。

また、上述のようにKENTA園主の襲撃がかなりの比重を占めており、それに関連して「レスラー」としてというワードも多く、またその「挑戦」に関する疑問を呈する様子が多かったのが印象的ですね。
他にも、戦前から本人が口を酸っぱくして主張していた「史上初の偉業としてのIWGP二冠」を再度確認するように「伝説」というワードも多かったかと思います。

また一方でドームでの試合に関する振り返りはほぼなく、対戦相手だった、ジェイ・オカダに関する言及もありはするもののほとんど試合については触れずという感じ。
これ淫関してはいつぞやのプロフェッショナルでのインタビューで「勝った負けたたでプロレスをしていない」という発言をしていたことから見るに、試合自体に関する拘りであったりは少なくとも今年のドームでの2戦に関しては全然なかったということかもしれません。

2.10 大阪城ホール一夜明け会見

f:id:Rodyonsw:20200321013636p:plain

続いては2.7に行われた大阪城ホール大会後の一夜明け会見の解析結果。
まず前提として同大会のメイン後には同LIJの高橋ヒロムが内藤との一騎打ちを提案し、この会見にも内藤に先駆けてヒロムが会見に乱入して菅林会長へ一騎打ちを直談判して去っていくという一幕もありました。
それもあってか最も大きく表れているのが「高橋ヒロ(ム)」及び「ヒロム」の二つ、なぜ高橋ヒロムで検出されてないのかは単純にサイズが合わずに切れてるだけか?
これを見てもかなり内藤選手本人として高橋ヒロムとの一騎打ちに賭けている部分はあった気がしますね。
またそれに関連した「帰っ」というワードはヒロムが海外遠征から帰ってきたらやろうという約束をしたいうエピソードを1パラグラフ使っているのでその歴史、そしてこの一戦の重要性を強調したかった部分はあるかもしれません。

また、ヒロムに続いて多かったのは「KENTA」選手の名前でドーム二連戦と比較すると前哨戦もかなりじっくりやってきたこともあって会見の最初にその構想自体を振り返る部分がありました。
そう思うとドームにおいてはジェイともオカダとも抗争らしい抗争は無かったといえばそうですわ。
また会見の最後には岡本記者とのいちゃつきで「質問」に関する話をしていたので質問も多いですね。

 

所感雑感

というわけでWordCloudによる会見解析でした。
新日本の公式サイトのスクレイピング自体は何回もやっているのでお手の物、というか最悪手動でコピペすればできるんで楽なんですが、WordCloudを使った解析は如何せん初めてだったので中々苦戦しましたね。
とはいえ検索すると結構日本語でWordCloudをPythonで作る記事は結構あったのでそこを参考にすれば結構楽ではあったんですが。

今回は内藤さんの会見2つに関してやってみたんですが、やはり会見だとほぼ一人しゃべりなので本人とその時の主張で結構特色が出て全然違う結果になるのは面白いところですね。
とはいえ会見はIWGPヘビー(2冠)王者しかしばらくなさそうなので今後は少し前の会見なんかを振り返って解析しようかなぁと思っています。
そういう意味でいうとインタビューはいろんな選手のがあっていいんですけど如何せん一部無料公開の形式なので文章量が多くないのがなぁ。

また今回で日本語の文章の解析ができるようになったので、今後は大会時のツイートの文章を取得して、実際にどういうツイート内容が多かったのか?を解析して見たいところです、はたしてちゃんとプログラムが動くのか心配ですが。
そういう意味だと早く興行が再開するのが楽しみでしかありません。

きょうはこれまで、それでは