弊ブログだと(最近はあんまり記事にしてませんが)ツイート解析というのをやっていまして単純な毎分のツイート数の推移なんかは報告していました。
例えば上図は3.21の新日本プロレスNEW JAPAN CUP決勝での#njcupfinalにおけるツイート推移で、瞬間的なツイート数の多さ=盛り上がりの度合いとしてこれまで用いてきました。
とはいえその中身については実際にそのタイミングのツイートを何件か見て類推するしかありませんでした。
話は全然変わるんですが最近VTuberの配信を観だしてn7i_fans (@bot_n7ifans)というアカウントを見つけまして。
こちらはVtuberが配信した時の視聴者数とコメント数とその簡単な内訳を投稿するbotなんですが、弊ツイート解析だとリアルタイムの視聴者数はできなさそうなんですが、ツイート内の内訳は見れるし見ても面白いかなぁと思ったので今回は上述の#njcupfinalを題材にちょっとやってみた報告です。
手法
集計としてはいつものツイート解析プログラムを改良し、ツイート内容を毎分ごとに分けて保存するように変更しています。
注意点としてはサイズがデカいことで、この日のツイートは(リツイートも含め)2万件ぐらいですがツイート内容のデータはそれで2MBぐらいになったので毎回これを集計するわけにはいかなさそうですね(WWEのPPVとかだと10万100万行くこともザラだし)。
で、コメント内容についての解析については以下の記事などを参考にしました。
文章の形態素分析にはMeCabを使用し、どんなワードが多かったのかの図示についてはWordCloudを使いました。
またこの際頻出単語の中でもあんまり興行・試合内容に関係ないようなワード(#njpwとかのタグ、「試合」とか「今日」とかの単語)は省くようにしています。
頻出単語WordCloud
3.21の#njcupfinalに投稿されたツイートについてのWordCloud結果が上図。
大きい文字ほど出現頻度が高いワードになっています。
最も大きい文字だったのは「オスプレイ」や「鷹木」というメインにしてNJC決勝を戦った二人でですがそれに加えてその試合中及び試合後に出てきた「ビー(・プレストリー)」の名前も大きい感じですね。
それに加えて興行開始時に復帰宣言をした「YOH」なども大きいですね(「YOH復帰」という文字も見える)
この辺はTLの様子を見ていて知っていたんですが以外に「ヘナーレ」の文字も大きいのでヘナーレも何か目立つ、話題になるようなことをしたことがこの結果からでもわかります。
こういった固有名詞以外でいうと「いい」「凄い」「~~すぎる」なんて言うワードも多かったあたり結構好意的な反応が多かったのではないかと。
勿論興行の映像なりをちゃんと見なければ実態までは把握はできませんが、おおよその雰囲気をWordCloudから把握することは可能ではないかと思われます。
頻出単語出現率推移
調べた結果、全体を通して出現頻度が高かったのが「オスプレイ」「鷹木」「ビー」「YOH」「ヘナーレ」の5ワードでしたが、この5ワードの毎分の出現割合を調べてみたんが上図。
割合なのでツイート数が少ない部分(14時以前と17時頃)はあんまり信頼性が低い気はしますが。
推移を見てみると、まず興行開始板直後に「YOH」(赤色)の割合が急激に増えているのが分かります、勿論YOHがサプライズ登場し復帰宣言をしたため話題に上がったと言えるでしょう。
次に15時過ぎには「ヘナーレ」(紫)の割合が一気に増加しており、TL上で注目を集めていたことが分かります。
で、15時50分ごろからメイン開始で「オスプレイ」(青)と「鷹木」(オレンジ)がかなり増えます。
注目すべきは試合中と思われる16:30ごろまでは鷹木の方が割合が多めだったのが、試合決着後には勝利したオスプレイが一気に増えている点で、言ってみれば観戦者としては鷹木に感情移入もしくは鷹木視点で試合を実況していた、ということも推測できます。
こういった情報は今までのツイート数からは伺えなかったので新しい情報ですかね。
一方試合後は勝利した「オスプレイ」とまさかの決裂をした「ビー」(緑)が一気に増え、それまで主だった「鷹木」のツイートが減ります。
言ってみれば試合後の印象を決裂劇で一気に書き替えることに成功していると、このデータからは言えるでしょう。
「空気を変える/空気が変わる」なんていうのはよく使われる割にあいまいな表現ではありますが、その数値化ができているとも言えるでしょう。
所感雑感
というわけでちょっと新しい手法に手を出してみたっていう奴でした。
冒頭紹介した奴は自動で集計・投稿までやってるのでそれに近いシステムできたら面白いんだがなーとは思うんですが、YouTubeの配信とはまた別でしょうしね。
とはいえこういうのが中継直後に出せると面白いとは思うのでなんとかかんとかやってみたいとこではあります。
まぁその辺は要勉強なので期待なさらず。
いずれにしてもこれまで自分の印象で推測していた部分に数値的解析を入れることが出来そうなのでこれはこれで満足。
きょうはこれまで、それでは