これまでにも弊ブログで様々な解析に用いてきたTwitter。
何か面白いことはないものかと日々コードをいじっているんですが、今回調べたのはいわゆるメディア付きツイートについて。
ツイートのエンゲージメント(クリック、リツイート、返信、フォロー、いいねなどの行動)を手っ取り早く上げる手法として「メディア(画像・動画)付きでツイートしよう!」などと挙げられていたりもするのですが、果たしてそれってどれぐらい効果があるのか?というのがそもそもの発端。
というわけで今回はこれまで集計してきたデータを用いて、メディア付きツイートによるエンゲージメントへの影響についての解析をおこないました。
結果としてある条件下においてメディア付きツイートはメディア無しツイートに比べて2~5倍のエンゲージメントがあることがわかりました。
それではさっそく見ていきましょう。
(プロレス要素はちょっとあります)
集計手法
ツイートの集計用ブログラムはすでに公開しているものを少し手直しして用いました。
上記プログラムでは各ツイートの辞書中に”retweeted_status”のキーがあるものをいわゆる「リツイートされたツイート」として認識し、その中にあるツイート自体のIDやツイートしたユーザーの情報などを取得しています。
このツイート内にメディア(画像や動画などのファイル)が含まれている場合、ツイートに関する情報が納められた”entities”キー以下に”media”のキーが存在します。
よってこの”media”が存在するかどうかを各リツイートについて情報収集しました。
これによってリツイートされたツイートについてその「リツイート数」及び「メディアツイートの有無」がわかるわけです。
これによってメディアの有無によるリツイート(∈エンゲージメント)への影響を調べます。
この手法について思いついたのが先月5月19日なので取得したデータは5月19日から6月11日までの間のみです。
#njpwにおける集計結果
まずは上記の集計期間においてリツイートされた#njpwを含むツイートの集計結果について。
今回は、同じリツイート数になったツイートの件数を集計し、上の図のようにプロットしています。
その結果が上の図になり各データ点をメディアありのデータを水色、メディアを含まないデータをオレンジ色の〇で示しています。
この図の横軸がリツイート数(RTcount)、縦軸がツイートの数(tweet num)を記録したツイートの数になっています。
この際、各データ点についてリツイート数及びリツイート数にかなり大きなばらつきがあったので両対数グラフの形でのプロットを採用しました。
上図で示した点線は各データ点に対してフィッティングを施したものであり、そのフィッティング関数が凡例の部分に書いてあります。
その結果としてメディアのありなしにかかわらず、1~数10リツイートを記録したツイートの件数についてはこのグラフ上で線形に減少していることがわかります。
この部分における傾きの大きさはメディア付きの場合で-1.94、メディアなしの場合で-2.08程度と僅かながらメディア付きの方が傾きが緩やかですがほとんど同じー2程度となっています。
この両対数グラフ上における1次関数の傾きはそのまま縦軸の数値(ツイート件数)が横軸の数値(リツイート数)の何乗に比例するかに対応しますが、つまりツイート件数はリツイート数の2乗に反比例する関係にあることがわかります(この関係性についてはおおよそ後述の結果でも同じです)。
また上図における切片の違いは、フィッティング関数の係数に反映されますが、今回はメディア付きのデータは係数が1289とメディア無しのデータは267となっており、実に5倍近い差が生じています。
これはすなわちメディア付きツイートの方がメディアなしツイートよりもはるかリツイート(=エンゲージメント)されやすいという可能性を示しています。
国内他団体における集計結果
先述の#njpwと同じく国内のプロレス団体に関するハッシュタグ#ajpw #bjw #ddtpro #dragongate #noah_ghc #w_1についての集計結果がこちら。
それぞれ次数や係数の違いこそあれ、その場合でもメディア付きツイートがメディア無しツイートよりもリツイート数が多い傾向にあるのがわかると思います。
すべての国内団体のハッシュタグを調べたわけでもなく、さらにはプロレスに関するツイートのみというかなり限られた条件のツイートのみの集計ではありますが、この結果を踏まえるに「日本国内のプロレス団体に関するハッシュタグ」という限られた条件においては「メディア付きツイートがメディアなしツイートに比べて数倍リツイートされやすい」状況にあるということが言えるかと思います。
国外団体における集計結果
しかしその一方で、同様に国外のプロレス団体において同様の集計をしたものの全く異なる結果が得られました。
上記でしらべたのは#AEW #WWEという海外プロレス団体に関するハッシュタグ。
日本国内団体と同じく、メディアの有無によって傾きについては大きな違いは見られませんでしたが、メディアの有無によってリツイート数の分布にまったく違いが見られないという結果が得られました。
これについてはリツイート数の規模もけた違いだったりもするので、日本とアメリカの違いによるものなのか、単純に総リツイート数の規模の違いによるものなのかは現状わかっていません。
係数/次数まとめ
簡単に次数/係数についてまとめたものがこれ。
いずれもメディアの有無によって次数に関する差は±0.5程度と小さいものですが、係数については、国内では2~5倍程度の差があるのに対し、国外2団体についてはほぼ同じかむしろメディアありの方が少ないまである様子。
所感雑感
というわけでいろいろ調べて結果「リツイート件数はおおよそリツイート数の2乗に反比例する」という共通傾向があるのはわかりましたが
なぜだかわからんが「日本国内ではメディアの有無でツイート件数に数倍近い差があり」また「日本国外ではほとんど差がない」というのがまとめでしたかね。
本当は「なぜ二乗に反比例するのか」まで突き止めたかったんですけど如何せん統計をまともに学んでなかったのでさっぱりわからなかったという、どなたか詳しい人がいたらぜひコメントに。
とはいえいずれのハッシュタグにおける結果でも、1~数十RTまでは2乗に反比例するもののそれ以上となるとその関係性から逸脱していくようで、
いってみればこの関係性から逸脱したツイートを「バズった」と定義しても良いかもしれませんね(#njpwであれば、メディア無しなら20RT、メディア無しなら30RT以上って感じか)。
これを踏まえるに「リツイートが欲しかったらどんどん画像付きでツイートしよう!」という感じですかね。
いつかもう少しデータがそろったら改めて詳しく解析したいところです、ほかの分野のハッシュタグもやってみようかしら。
きょうはこれまで、それでは