さてピョンチャンのオリンピックも終わった昨今皆様どうお過ごしでしょうか。
日中テレビを見る週間がないために全然見るタイミングが無かったんですが凄かったみたいですね、メダルの数も歴代最多とか言う。
こういうのってやっぱ時差が無いからよりいつものパフォーマンスができるとかそういうことがあるんでしょうかね。
それはさておき前回のその他まとめ記事で紹介した下の記事
2017年の内藤さんの全コメントを手で集計して解析を行ったもの、その労苦たるや・・・というところ。
ちなみにこの記事を読んだあとに著者のターキーさんと「コメントの自動集計ってできるんですかね?」なんていう話をして、その後試合結果集計のプログラムを元にあーだこーだした結果・・・
で き ま し た
大体1週間で集計自体はできましたね、とはいえ新日本の試合結果ページを順々に見て回って各ページのコメント部分だけを取り出すことまでは簡単だったんですよね。
しかしその後のどの部分が誰のコメントなのかの振り分けがねぇ・・・
結局、”「”の前にあるのが名前、”「」”の間にあるものがコメント、という振り分けで集計するのが一番巧いこと集計できましたけども、如何せん元のコメントが手打ちでいくつかタイポがあったりで集計ミスなどがあったりもしますがまぁ誤差だよ誤差!ということで勘弁してもらいたい。
しかも(ここで○○は立ち上がって)見たいな状況の説明文も入ってるからなぁ・・・これを取り除くことも後々。
さらに今回は仕様上試合後のコメントのみでリング上でのマイクなどは含まれていないのでそれも含めてご注意を。
とりあえず現在は集計だけできて、ターキーさんのやったような内容の解析については現在勉強中なので、そのコメント量について簡単な解析です。
2017年の総コメント量トップ10
名前 | 総文字数 | 回数 | 平均文字数 |
---|---|---|---|
ヒロム | 38,469 | 125 | 307.75 |
内藤 | 36,846 | 114 | 323.21 |
天山 | 33,599 | 96 | 349.99 |
田口 | 29,240 | 99 | 295.35 |
永田 | 27,473 | 84 | 327.06 |
ジュース | 26,203 | 79 | 331.68 |
オカダ | 25,194 | 103 | 244.6 |
小島 | 22,995 | 98 | 234.64 |
真壁 | 21,803 | 77 | 283.16 |
棚橋 | 19,740 | 115 | 171.65 |
まず初めに総コメント量(文字数)のトップ10。
1位はなんと(?)内藤さんを抑えてのヒロムが1位。
ヒロムと内藤さんを比較すると1回の試合後コメントでのコメント量(平均文字数)では16文字ほど下回っているもののコメント回数では10回ほど上回っていることでこの逆転が生まれたんですかね。
ちなみにそれぞれの2017年の総試合数はヒロムが147試合、内藤さんが145試合とほぼ同程度でした。
これでコメント回数を割ればヒロム、内藤のコメント率は85/78%と7%ほどの差が出ていますね(ちなみにオカダが74%、棚橋が89%)。
まぁこの二人は試合後コメントで相手をけしかけ、煽って因縁を膨らませるまさに「言葉を武器にする」タイプなだけに納得ではありますね。
それに続くのが天山や田口永田さんですが、そういえば天山もコメント長いなぁ・・・武器にしてる感はあんまり無いけど。
田口監督は田口ジャパン以前の6・9チャンピオンの辺りから結構増えている印象で、永田さんは相手や大会について総括的なコメントが多かったような。
トップ10のコメント量推移
ではそのコメント量の推移をプロットしてみたもの。
これを見るとヒロムとジュースの2016-2017の増加がすごいですが、ヒロムは2016年の年末に2試合程度しただけだったので仕方がなかったのと、ジュースはよくよく結果を見てみると「ジュース」表記と「ロビンソン」表記が混在してた時期があったりもしたのでそのせいかなぁと(2017年は多分ジュースで統一)。
こういう2012-2017の推移を見たときに如実な変化を示すのが内藤さんなんですが、コメント量についても2012-2015年にかけて2万コメント弱だったのが2016年にほぼ倍増し、2014年以降トップだった天山を追い越して1位になっていますね。
こういう変化をみても、2016年に「言葉を武器にする」という選択肢を内藤さんが選んで実際にその言葉を大いに使っていたことが見て取れますね。
2017年は微減しているんですが、これはひとまずコメントによる構成が一段落したことを示しているのか、それとも2017年から同じぐらいしゃべるヒロムがでてきたことでちょっとコメントする機会が減ったのか・・・
基本的にこういうデータは個々人で見所を見出してもらう方針ではありますが、個人的興味としてオカダさんのデータに注目すると
2012年以降基本的に右肩上がりで2016年から特に増加している感じですね。
2012年は勿論外道さんが変わりにしゃべってたっていうのがあったんですが、2016年からはコメントも一人で出すようになった(増えた)事の現れですかね。
下は上のデータを表にしたものなので参考までに
名前 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 |
---|---|---|---|---|---|---|
ヒロム | -- | -- | -- | -- | 822 | 38,469 |
内藤 | 21,374 | 17,197 | 13,508 | 16,210 | 40,508 | 36,846 |
天山 | 25,152 | 15,629 | 20,881 | 30,747 | 32,576 | 33,599 |
田口 | 14,315 | 6,330 | 17,823 | 15,626 | 22,252 | 29,240 |
永田 | 20,267 | 14,645 | 14,410 | 16,949 | 25,853 | 27,473 |
ジュース | -- | -- | -- | 12 | 1,489 | 26,203 |
オカダ | 9,521 | 12,624 | 13,763 | 13,862 | 21,772 | 25,194 |
小島 | 17,960 | 15,710 | 15,820 | 17,723 | 20,427 | 22,995 |
真壁 | 21,240 | 21,834 | 16,408 | 27,523 | 21,673 | 21,803 |
棚橋 | 21,901 | 15,203 | 18,660 | 19,617 | 16,227 | 19,740 |
所感雑感
というわけで試合後コメント集計、そしてコメント量について簡単な解析でした。
自分でも「まぁ内藤さんが一番多いんやろうなぁ」と思って集計してたのでヒロムが1位だったのには驚きでしたね。
しかしまぁ本題は中身の解析なのでこれから勉強したいと思うので気長に待っててください。
ターキーさんの使ったツールにぶち込んでもいいんですけどPythonでもできるみたいなので頑張って組み込みたいとこですね。
それはそうと、ターキーさんの手動集計だと内藤さんのコメントが53,616文字だったのに対して今回自分で行った集計では36,846文字・・・1万文字近く誤差があるんですがそれは・・・
それについてはちょっと確かめないとなぁ、マイクで1万文字も差がつくのかな?
ちなみに集計した総コメント量は2,965,780文字おおよそ300万文字でした、そりゃ集計に6時間ぐらいかかるわけだ・・・
それでは
おまけ
集計した2012-2018年の全コメントトップ10です、天山内藤真壁の不動のトップ3感たるや
1回のコメント量で言うとタイガーがダントツで多いんですけどね(確かに話長いよなあの人・・・)。
名前 | 総文字数 | 回数 | 平均文字数 |
---|---|---|---|
天山 | 159593 | 495 | 322.41 |
内藤 | 148311 | 486 | 305.17 |
真壁 | 131209 | 453 | 289.64 |
永田 | 119725 | 430 | 278.43 |
棚橋 | 112896 | 618 | 182.68 |
小島 | 111551 | 537 | 207.73 |
田口 | 107692 | 470 | 229.13 |
オカダ | 99410 | 580 | 171.4 |
KUSHIDA | 96121 | 460 | 208.96 |
タイガー | 91380 | 269 | 339.7 |