talosのプログラミング教室

AIは東海オンエアのメインとサブチャンのサムネを見分けることができるのか

スポンサーリンク

はじめに

みなさん、東海オンエアをご存知でしょうか?

私が大好きなYouTuberです。

先日の動画があまりにも面白かったので置いておきます。

私は毎日東海オンエアの動画を見ているわけですが、ふと思いました。

「メインとサブチャンのサムネって雰囲気が違うけど、AIはわかるのかな?同じ人が映ってるしわからないんじゃね?」って。

そんなわけでやってみました。

ソースコードGitHubに置いてあります。

サムネを集める

まずはサムネを集めました。

方法は、YouTube Data APIでサムネのURLを取得し、そのURLにアクセスして画像を保存します。

2016年1月1日以降のサムネを集めたところ、メイン、サブそれぞれ1000枚以上集まりました。


参考:YouTubeチャンネルの動画を自動で全保存してみよう - ハンバーグのおいしい季節

CNNで分類

CNNモデルを構築し、訓練、テストを行いました。

f:id:talosta:20190822224957p:plain

なんと正解率90%越え!

さすがに驚きました。

これはもうAIは東海オンエアのメインとサブチャンのサムネを見分けていると言ってよいのではないでしょうか。

でも、テストの損失関数が大きいのが気になりますね。

恐らく画像データが足りないので、今後に期待です。


参考:KerasのCNNを使用してオリジナル画像で画像認識を行ってみる - AI人工知能テクノロジー


ちなみに、間違えてサブに分類されたものは、「割れるか微妙なもので風船を割れ対決!!!」などのてつやの実家で撮った動画や、「【モンスト】ツクヨミ零に初見チャレンジ!!ぬおおおおおおお!!」などのモンストの動画が多くありました。

また、間違えてメインに分類されたものは「【ゴルフ同好会】てつや、高級キャディバッグを買う??」、「てつやの部屋の中から好きなものを強奪してみよう ほぼフルver.」などメンバーが正面を向いているサムネが多いような印象を受けました。