視聴率以外の評価方法の検討。好評価率(偏差値)、盛り上がり、キャスト言及数、共起ネットワーク

2017年7月27日コラム, 視聴率及びまとめ

このブログでは、視聴率以外の方法でドラマを評価することを検討しています。

 

このブログの目的のひとつは「良いドラマと視聴者をつなぐこと」。(このブログについては以下のページもご覧ください)

私のことと、このブログについて

 

そのためには、どのドラマが「良いドラマだったか」を客観的に評価する必要があると考えました。

以前は、テキストのネガポジ判定を応用した手法を提案しました。

視聴率以外の評価方法としてネガポジ判定を応用した好評価率を検討

 

この記事では上記の方法を応用して好評価率を測定。さらに、盛り上がりグラフ、各キャストの言及数比較、共起ネットワーク図による感想の可視化も試みています。

 

この記事の目次

好評価率

まずは前回と同じくテキストのネガポジ判定を利用した方法。ネガポジ判定とは?

簡単に言えば、テキストの中にあるポジティブな単語(素晴らしい、秀逸、最高など)とネガティブな単語(ダメ、酷い、劣悪など)を調べて分析することによって、そのテキスト全体がポジティブなものなのか、ネガティブなものなのかを判定する手法。

これをドラマの評価に応用する。例えば、「面白い」「感動」「可愛い」などの単語が含まれるテキストを好評価とし、逆に「つまらない」「下手」「ブス」などの単語が含まれるテキストを悪評価として分析する。

これを6つの評価軸および総合で判定する。

 

最近ではSNSが発達しており、視聴者がドラマの感想をSNSに投稿するケースが多いです。そこでSNSの分析をおこなうことにより、ドラマの評価を分析したいと考えました。対象のSNSは投稿数が圧倒的に多いTwitterを採用することにしました。

 

サンプルとして、「コード・ブルー」第3シーズンの第2話を分析してみました。

 

上記の表の通りですが、評価軸は以下の6つ。

・面白いかどうかの表現

・期待できるかどうかの表現

・(キャストが)可愛い、イケメンであるかどうかの表現

・(キャストや演出が)上手いかどうかの表現

・好きかどうかの表現

・その他の表現(癒された、役に立つ、爆死など)

これらに加えて「総合」で判定する。まだまだ実験段階ではあるが、比較的精度が高いのは「面白いか」「可愛い・かっこいい」および「総合」だと思われる。

 

ちなみに、対象のテキストを選択する時に「#コード・ブルー」というハッシュタグ付きの検索ワードを使ったが、これはこの検索ワードで対象のツイート数が3800程度あり、十分であると考えたため。

例えば不人気なドラマであれば、ツイート数が少ないために、ハッシュタグ付きの「#コード・ブルー」だけではなく、ハッシュタグなしの「コード・ブルー」、あるいは「コードブルー」などのワードも検索対象に加えるべきなのかもしれない。これは適宜選択します。

なお検索の対象期間は原則として、ドラマの開始時間から、終了時間の数分後までとします。

 

追記:データが蓄積されてきたため、偏差値による表示とした。

 

偏差値なので平均値は50。それを上回れば全ドラマ平均より評価が高い、下回れば低い。

 

盛り上がり

ドラマがどの時点で盛り上がったのかを調べることにより、その回における名場面等の収集に役立ちます。

同じく「コード・ブルー」第3シーズン第2話をサンプルとします。

 

横軸はドラマ開始からの経過時間(分)、縦軸は30秒毎のツイート数。

この回で最も盛り上がった地点は12分30秒の地点だが、これは主演の山下智久さんが、周知の事実だと思われた同僚の交際を知らず「付き合ってたのか?」などと発言し、戸田恵梨香さんに「そこから?」とつっこまれた直後のCM中である。CMのときはツイート数が多くなる傾向があるので少し差し引く必要があるかもしれない。

 

追記:各盛り上がりポイントを★マークで示し、その時点の盛り上がり度(30秒間あたりの投稿数)および各時点の解説を入れるようにした。

追記:各キャスト別の盛り上がりグラフを併載するようにしました。お気に入りのキャストが出演したり活躍したりした時間を確認できます。

 

キャストの言及数

ドラマを通じて、どのキャストに対するツイート数が多かったかを調べる。良かれ悪かれ、誰がドラマの中で影響力を持っているのかを推し量ることができる。

これも、「コード・ブルー」第3シーズン第2話をサンプルとし、主要4キャストを対象としました。

例えば山下智久さんを調べたいときは、「山下智久」だけではなくて、愛称である「山P(アルファベットPは、全角も半角もあるので両方を調べる)」や「山下」、役名である「藍沢」も対象にする必要があります。

この調査では、主演の山下智久さんに対するツイートが圧倒的になっていて、良くも悪くも彼のドラマに対する影響力は大きいということが推し量ることができます。

 

追記:ポジティブな言及、ネガティブな言及、どちらでもない言及を色分けして表示するようにした。

 

共起ネットワーク(KH Coder)

テキストデータの統計分析を行うソフト「KH Coder」によって「共起ネットワーク(サブグラフ (媒介))」を作成し掲載する。

「共起」とは、ある2つの単語同士が文章の中に頻繁に出現すること(らしい)。例えば、「ガッキー」と「可愛い」は同じ文章の中に同時に出てくる事が多い。これらの関係を図に表したものが「共起ネットワーク」と呼ばれるものである。

以下の礼では、TBS「カンナさーん!」の第4話を用いて共起ネットワークを作成した。

 

「渡辺直美」と「可愛い」、「服」と「デザイン」と「戦争」、「斉藤由貴」と「不倫」、「義母」と「嫌」、「元気」と「出る」、「同居」と「無理」、「味噌汁」と「トマト」など、この回を見ていればパッと思い浮かぶ場面ばかりだし、みんながドラマのどこに着目していたのかもよくわかると思います。

 

KH Coderについては以下を参照下さい。

http://khc.sourceforge.net/

 

考察

ドラマを視聴率以外の観点から評価する、という試みは、まだ実験段階です。

このサンプル以外にもいくつかやってみたのですが、ドラマごとにかなり傾向が違ったりして、面白い結果が得られました。

 

もちろん、今回の方法が絶対ではありませんので、今後も改良していきます。視聴率では、1%の違いが大違いと言われますが、それで本当にただしくドラマを評価できているのか常に疑問があります。これ以外にも、様々な方法を検討していきます。

 

視聴率

視聴率も今現在重要な指標として存在します。ただし、視聴率の信憑性や統計上の問題については、問題を指摘されています。

データの誤差については以下のような問題が存在(Wikipediaから)

ビデオリサーチ社の調査方法では、標本数600・信頼度95パーセントの場合、視聴率10パーセントの時の誤差は±2.4ポイント、視聴率20パーセントの時の誤差は±3.3ポイントである。つまり、「視聴率20.0パーセント」と発表された場合の視聴率は「16.7 〜 23.3パーセントの間にある」確率が95パーセントということである

 

この誤差を考慮しつつ、ドラマにおいては1回の視聴率単体で見るより、第1回からの推移を見ることが重要だと考えています。そのため以下のようなグラフを作っています。

 

太い線はビデオリサーチ社の調べによる関東地区の視聴率。上下の細い線は、いわゆる「誤差の範囲」をあらわす。統計でよく使われる「信頼度95%」の区間を示している。100回計測したら、95回はこの範囲に収まるということである。

赤字又は緑字は、前回からどれだけマイナス又はプラスになったかをあらわす。その下の数字(in/out)は前回よりどれだけ流入または流出したかを示す(例えば、第2回の視聴率が12.6%で第3回が10.1%だったとすると、第3回を視聴した人数は第2回を視聴した人数より19.8%少ない、つまり流出したと推定される)。

 

また、同じ枠で以前放送されていたドラマとの比較も有効だろうと思います。

視聴率は、特に断りがない限りビデオリサーチ社調べの関東地区の数字を使用。ネットニュースやWikipediaなどで公開された数字を使用しています。

 

最後まで読んでいただき、ありがとうございました。