IT社員3人組によるリレーブログ

某IT企業に勤める同期3人が、日常で思ったことを記録していきます (twitter: @go_mount_blog)

芸能人の好感度をAIで分析してみた話

けいです。久しぶりの投稿です。

今回は「芸能人の好感度」をAIで分析してみた話をします。

 

芸能人の好感度を分析した経緯

 

突然ですが、みなさんは「芸能人の好感度」に疑問を覚えたことはないでしょうか?

 

スーツを着た女性のイラスト(疑問に思う顔)

 

結論を言います...

好感度って定性的で曖昧すぎない?

(ちなみに「定性的」とは、数値化できない感覚的なものという意味です)

 

元々、好感度は人が人に対して感じるものなので、曖昧でも良いのかもしれません。

ただし、「芸能人の好感度」が下がる場合、下記の問題が発生します。

 

CMに起用していた芸能人が問題を起こし、宣伝のつもりが逆効果になってしまった

 

映画やドラマに起用していた芸能人が問題を起こし、代役の調整やブルーレイ・DVDの回収が必要になった

 

スポンサーからすると、たまったものじゃないでしょう。

2度と起用したくないというのが本音だと思います。

 

一方で、芸能界にはトラブルがつきものです。

1年を通して不祥事などの問題が大小たくさん発生しています。

そのため、完全に「クリーン」な人はごく少数なのではないでしょうか?

 

最近でいえば、木下優樹菜さんの「タピオカ恐喝騒動」、「ツイッター縦読み不倫」や東出昌大さんと唐田えりかさんの「不倫」がありました。

 

これらの芸能人も、時間が立てば好感度は回復していくかもしれません。

しかし、好感度がどのくらい回復したかは明示的にはわかりませんよね。

 

実際に、過去に不祥事を起こした芸能人でテレビに出ている人も、会見を上手くやったり、その人のキャラで切り抜けたりと曖昧なものです。

好感度が回復していないまま、テレビに出ている人もいることでしょう。

 

このように、曖昧な好感度というものを可視化して、定量的に見てみよう!というのが今回のコンセプトです。

 

好感度をAIで分析したサイトを作ってみた

 

今回は、ただ好感度を分析するだけでなく、サイトを作成しました。

ai-net-judge.com

 2019年に問題を起こした人や話題に上がった人を載せています。

 

f:id:go-mount:20200128150700p:plain

トップページ

f:id:go-mount:20200128150909p:plain

掲載している芸能人(一部)

 

各芸能人の個別のページには、1日ごとの好感度の推移を載せています。

これを見れば、芸能人の好感度がどのように変化しているか見ることができます。

 

f:id:go-mount:20200128151301p:plain

好感度のグラフ(木下優樹菜さんの場合)

好感度の可視化方法について

まず、今回のコンセプトの肝となる部分である、好感度をどのように数値化するかについて説明します。

やり方はいろいろあると思いますが、今回は下記のステップで好感度を分析しました。

 

  1. 1日に芸能人に対してつぶやかれたツイートをランダムに一定数取得
  2. Googleの提供しているAI感情分析を利用して、各ツイート内容がポジティブかネガティブかどうかを-1から+1の間で点数化
  3. 芸能人の各ツイートの点数を1日ごとに平均する

 

1. ツイートをランダムで取得する

好感度を分析するにあたって、分析元のソースをどこにしようかという話です。

結果、ツイッターにしました。

 

インスタ、フェイスブック、ブログなど候補はたくさんあるのですが、ツイッターは芸能人の不祥事などがバズったり、それがwebニュースとして拡散されたりと影響度が大きいため、ツイッターにしました。

 

各芸能人の名前で検索をかけて、ヒットしたツイートの中からランダムで選んだツイートを後述する方法で分析します。

 

2. ツイート内容をAIで点数化

 さて、評価したいツイートが手に入ったので、こちらを点数化していきます。

 

評価方法もたくさんあると思いますが、今回はGoogleが提供する感情分析AIを使って分析しました。

(正しくはGoogle Cloud PlatformのGoogle Cloud Natural Language APIの感情分析機能を利用します)

 

簡単に説明すると、この機能では、ある文章が全体としてポジティブな内容かネガティブな内容かを-1から+1の間で点数化できます。

つまり、-1に近づくほど、ネガティブな内容であり、+1に近づくほどポジティブな内容です。(サイト上では、100点満点に直して記載しています)

 

この機能を利用して、1で取得したツイートの内容がどれくらいネガティブな内容かポジティブな内容かを点数化して評価しているのです。

ここがまさに、好感度を数値化する部分です。

 

3. 好感度を1日ごとに平均

上記の1、2のステップでツイート内容に対して好感度の点数をつけることができました。

ある芸能人に対して1日につぶやかれた複数のツイートを点数化をして、1日の好感度の平均を計算します。

これを1日ごとにグラフとして表示したものが下記です。

 

f:id:go-mount:20200128161330p:plain

好感度の1日ごとのグラフ(木下優樹菜さんの場合)

 これにより、1日ごとに芸能人の好感度がどのように移り変わっていくか可視化することができました。

まとめ

さて、上記のようなステップでツイート情報から芸能人の好感度を分析することができました。

この情報によって、各芸能人の好感度が現在どうなっているかをパッと見るだけで判断できるようになりました。

(精度はともかくですが、ある程度情報として判断できるものとなっているのではないでしょうか)

 

これによって、芸能人の不祥事がある程度可視化され、「許された」/「許されない」をなんとなくの流れで決めないきっかけになったら面白いなーと思った次第です。

 

今は、不祥事系の芸能人にスポットライトを当てて掲載していますが、もちろん好感度が高い芸能人同士、点数をバトルするみたいな使い方も楽しいと思います。

 

掲載して欲しい芸能人がいれば、コメントいただくかツイッターでDMください!

 

予告

今回、このサイトはGoogle Cloud Platform上で感情分析だけでなく、アプリも基盤部分も仲間3人ですべて作成しました。

その際の構成や使用技術のノウハウがだいぶたまったので、よりテッキーな内容は別途記事としてまとめようと思います。