プロレス統計

「プロレスの数字とプロレスする」をテーマにプロレスに関連する数字を調べ、まとめ、考えるブログです。

MENU

【Twitter】プロレス団体フォロワー関連性解析ほか

さてつい先日、丸2日をかけて集計した国内の各プロレス団体のフォロワー情報についての報告をしたわけですが、せっかくなのでもう少し違う面からの解析をしていこうと思います。
というわけで今回は、要素同士のつながりの強さを表すときに用いられる共起ネットワークを用いた解析と、これまで集計していた各団体ハッシュタグでつぶやいたユーザーの情報との比較を行っていきます、追い解析です。

一次報告

www.pwanalysis.com

 

フォロワーによる団体間共起ネットワーク

まず初めに弊ブログでもあんまり登場頻度が高くない共起ネットワークなるものについての説明ですが、とりあえず下記事を引用しておきます。
文章とかを解析するテキストマイニングにおいて、「どういう要素(単語)の登場頻度が高いのか」「どの要素(単語)と要素(単語)が関係性が強いのか」という要素を調べることによって文章の特徴づけを行うのですが、その結果を図示するのに使うのが共起ネットワークになります。
大体引用記事のサムネイルのように円(ノード)とそれをつなぐ線(エッジ)で表されますが、上記の要素の前者が円の大きさに、後者の要素が線の太さや円同士の近さによってあらわされます。

antibayesian.hateblo.jp

で、今回は集計した各団体のフォロワー情報を用いて共起ネットワークを作ってみます。
今回でいうとノードの大きさはそのまま「団体のフォロワー数」を用いるとして、各ノード間の関係性の強さの指標として「団体間で重複しているフォロワー数」を用いました。
つまりフォロワー数が大きいほど大きい円で示され、重複ユーザーが多いほど近くに表示される共起ネットワークになります。
ちなみに各要素の図上での位置は一意には決まらないので計算をするたびに図の形状が変わったりします。

f:id:Rodyonsw:20190927233904p:plain

得られた共起ネットワーク図がこちら、今回は何となくノードの色を団体ごとに変え、エッジの色も太い順に赤、黄、緑、青、灰にしてみました、色が多すぎるんじゃ。
ノードのサイズに関しては過去の解析のとおり新日本がかなり大きく、全日本やDDTがそれに次ぐ感じ。
こうしてみると新日本と最も近い(重複フォロワーが多い)のは全日本でかなり近く配置され、それに次いでノア、DDTなどが近い感じですかね。
この3団体についてはお互いの間で重複もあるのでそこそこ近い位置に配置されていますが、
こうしてみるとドラゴンゲートと大日本はかなり離れた位置に、重複フォロワーが少ない位置にいますね。
単純にフォロワー数が少ないのもあるんでしょうけど、現状少し縁遠い団体、というのか独自路線を進んでいる、差別化できているともいえるんですかね。

団体フォロワーvsハッシュタグユーザー解析

ここまで見てきたのは各団体の公式アカウントおよび所属選手アカウントのフォロワー情報だったわけですが、Twitterではこれまで各団体のハッシュタグにつぶやかれたツイート及びユーザー情報も集計してきていました。
どちらも同じ「団体のファン」にくくられるアカウントだとは思うのですが、前者が情報を収集することに重きを置いた受動的アカウント、後者が自らも情報を発信する能動的アカウントと種別が異なるため、その性質・分布が異なるんではないかな、と思った次第です。

フォロワー情報は9月26日ごろに集計した前出のデータを用い、ハッシュタグユーザー情報は2019年1月1日~2019年9月27日まで集計したデータを用います。
各団体のハッシュタグは新日本が#njpw、全日本が#ajpw、ノアが#noah_ghc、DDTが#ddtpro、ドラゴンゲートが #dragongate、大日本が#bjwを用いて集計しています。

ハッシュタグユーザーのみに関する重複度調査はこちら

www.pwanalysis.com

f:id:Rodyonsw:20190928134352p:plain

その集計結果がこちら。
followerは団体をフォローのみしているアカウント数(純受動型)、
tag_userはハッシュタグでつぶやきのみをしているアカウント数(純能動型)、
overlapがフォロー及びハッシュタグ投稿の両方をしているアカウント(受動能動両立型)、
そしてtotalは総アカウント数になっています。

こうしてみてみるといずれの団体でも純受動型が大半で、純能動型と両立型のアカウントがほぼ同数いるという結果になっています。
まぁ「情報のみを追いかけているがハッシュタグに投稿はしない」というアカウントが大半を占めることは体感に沿っているので驚きはないのですが、
割と驚きなのは「団体情報をフォローはしてないけどハッシュタグに投稿している」というアカウントもそこそこいる、どころかハッシュタグ投稿をしているアカウントの半分はそういうアカウントという事実です。
両立型は情報を収集した上で自分でも発信する、オタクの鑑みたいなアカウントが含まれているんですけど、それがややもするとかなり少数派になるとは・・・

f:id:Rodyonsw:20190927230804p:plain

今回は各団体において大きな傾向の差は見受けられなかったので新日本のデータでのみ、ベン図でデータを図示しますが。
上の図では赤色が純受動型、緑色が純能動型、黄色が両立型のアカウント数の規模を表していますが、純受動型が圧倒的ですね。
もし、能動型が受動型の中からよりオタク度を上げた結果生じるようなものであればtag_userの円がfollowerの円に含まれるはずなんですが、全然そんなことはない、というのが現実なようです。

f:id:Rodyonsw:20190927230820p:plain

実数値だとわかりづらいのかもしれないので、上図はそれぞれの総アカウント数に対する割合を%で示したものになります。
こうしてみると純受動型はいずれの団体でも90%近くになっていますが大日本は比較的低く80%台前半、その代わりに両立型、純能動型が多くなっていますね。

 

所感雑感

というわけで追い解析でした。
おかげさまで前回の記事が結構反響いただいて一人でやったぜ 投稿者:(以下略)と喜んでいたわけですが、反応の中に一つだけ「表の見方がわからん」というのもあったんですよね。
まぁ説明がちゃんとあるとはいえ、説明を読まなければわからない図というのも直感的でないよな、と思いつつ直感的にわかりそうな図の解析をしてみた次第です。
まぁ少し前から共起ネットワークについては勉強せねばと思ってたところですし、ベン図もつい先日使ったところなのでちょうどよかったんですが、科学の徒の一人として一般人にもわかる公表手法の模索は一つの義務でもあるなぁと思った次第です。

きょうはこれまで、それでは