talosのプログラミング教室

【A3RT】リクルートが無料公開した機械学習APIが凄すぎる!~Text Classification API編~

スポンサーリンク

はじめに

こんにちは.talosです.

今回はリクルートが無料公開した機械学習API群の「A3RT」を紹介します.

A3RTは

A3RT(アート)は「ANALYTICS & ARTIFICIAL INTELLIGENCE API VIA RECRUIT TECHNOLOGIES」の略称です。
A3RTは機械学習のなかでもDeep Learningなどに代表される、いわば人工知能とよばれる分野のロジックをひとつのブランドで統一・整備をし、社内へ展開するためにプロジェクト化されたソリューションの総称です。

昨今、リクルートグループ内においても機械学習を活用した施策開発のニーズが高まっていました。
しかし社外製品の利用は「汎用性が高いがゆえに、細かな利用ニーズに合致しづらい」、フルスクラッチ開発の場合は「自由度が高い一方で、時間・コストがかかる」といった課題がありました。
この現状を打破し、機械学習ソリューション活用の敷居を下げ、スピーディかつ低コストで施策への導入ができるよう設立されたAPI 群がこのA3RTです。

引用元:ABOUT | A3RT

とあるように,機械学習を簡単にサービスに組み込むことができるようにと作られたAPIです.

それが無料で公開されちゃうなんてすごいですよね.

使うのも本当に簡単なのでやってみましょう.

pya3rtをインストール

今回はpythonAPIを叩いてみます.

pip install pya3rt

上記コマンドでpya3rtをインストールしたら準備完了です.

Text Classification APIを使ってみる

文章の分類を行うAPIです.

デフォルトで求人の文章がどのような職種の求人かを分類するモデルが備わっています.

モデルを作るのは大変なのでデフォルトのモデルを使っていきます.

API KEYの取得

まず,Text Classification API | PRODUCT | A3RTを開き,一番下の「API KEY 発行」を押します.

f:id:talosta:20190925165611p:plain

その後.メールアドレスを入力する画面に移るので,メールアドレスを入力,利用規約・プライバシーポリシーに同意し送信します.

メールで送られてくるURLをクリックすると,もう一通メールが届き,そこにAPI KEYが書かれています.

プログラムからAPIを叩く

今回は以下の文を分類します.

「システムの企画から開発・運用まで幅広く関われます。」
「キッチン・ホールをやっていただきます。」
「人と関わることが好きな方大歓迎!」

一つ目はA3RTのWebページに例文として挙げられている「ITエンジニア」の求人,二つ目と三つめはそれぞれ「飲食」「介護」をイメージして私が作りました.

それでは次のコードを実行してみます.

import pya3rt

API_KEY = '****'  # 自分のAPI KEY

TEXTS = ['システムの企画から開発・運用まで幅広く関われます。',  # ITエンジニア
       'キッチン・ホールをやっていただきます。',  # 飲食
       '人と関わることが好きな方大歓迎!']  # 介護

client = pya3rt.TextClassificationClient(API_KEY)

for text in TEXTS:
    result = client.classify(text)
    print(text+'\n'+str(result['classes'])+'\n')


実行結果

f:id:talosta:20191009214149p:plain

一つ目のITエンジニアはうまくいっていますね.

これはA3RTのWebページで例文として書かれていたので,まあ当然です.

二つ目の飲食は3位と言えど,確率は14%とかなり低いです.

この文は明らかに飲食なのでもっと高くてもいいと思うのですが...

三つ目の介護はまさかのビリ.

確かに介護だけに当てはまる文ではありませんが,なんとも納得のいかない結果になりました.


こうしてみると精度はそこまで高いとは言えません.

デフォルトのモデルはそこまで訓練データの量が多くないのかもしれませんね.

おわりに

今回はリクルートが無料公開したAPI群「A3RT」の「Text Classification API」を使用しました.

他のA3RTについても使い方を書いていますのでよかったら見てください.

talosta.hatenablog.com