DataRobotとは?無料で使う方法やDataRobotの使い方を徹底解説

こんにちは、三谷です。
今回は、機械学習を自動化するAIプラットフォームDataRobotについて徹底解説します!

DataRobotとは?

DateRobot機能全体図

DataRobotは、AIを作成する際に必要になるPythonなどのプログラミング言語や専門知識を知らなくても、AIによるデータ分析や画像認識、数値予測などを行え、自社の業務で活用できるAIを作成できる機械学習プラットフォームです。

通常、AIを作成する際にはPythonを利用したプログラミングが必要であったり、機械学習のアルゴリズムを理解する必要があるなど、技術的なハードルが高い側面があります。
DataRobotを使うと、ノンプログラミングでAIを構築することができます。

 

DataRobotのスペック

価格数百万円~数千万円
インストール環境パブリッククラウド、プライベートクラウド、オンプレミス
データ準備ファイル読み込み、データベース読み込み、自動特徴量探索
モデリング分類、回帰、画像、異常値検知、時系列
デプロイAPI発行、精度・ドリフト監視、予測コード書き出し

DataRobotの特徴

DataRobotの以下3つの主な特徴について解説します。

  1. 簡単かつ自動で、最適な機械学習モデルを作成
  2. データの前処理の時間を削減
  3. 学習済みモデルの運用まで自動化

①簡単かつ自動で、最適な機械学習モデルを作成できる

DataRobotの主な特徴

データを読み込んで「開始」とクリックするだけで、1,000を超えるアルゴリズムの中から最適な手法を組み合わせて学習するステップを自動的に処理してくれます。
機械学習の知識がなくても使うことができます。

②時間のかかるデータの前処理の時間を削減できる

時間のかかるデータの前処理の時間を削減

AIプロジェクトの7割~9割がデータの前処理に時間がかかると言われるほど、機械学習モデルを作成する場合にデータの前処理の作業負担は大きいです。
データ前処理のツールを持っているため、時間を大幅に削減できます。

③学習済みモデルの運用まで自動化できる

学習済みモデルの運用まで自動化

学習をするだけではなく、学習済みモデルをデプロイし、本番運用にそのまま使用することができます。
大規模なシステム化を行わなくても、本番環境ですぐに実務運用ができるようになります。

DataRobotの機能

DataRobotの以下4つの主な機能について解説します。

  1. データの前処理
  2. データの特徴の確認
  3. オートパイロットによる自動モデリング
  4. MLOpsによる本番運用

①データの前処理

データの前処理

Paxataと呼ばれる、データの前処理を行うツールが備わっているため、Excelのような感覚でデータの処理を行うことができます

②データの特徴の確認

データの特徴の確認

データの数や欠損値の有無、平均値や中央値などの統計的な情報、ヒストグラム表示など、データを分析するための機能がついています。

③オートパイロットによる自動モデリング

オートパイロットによる自動モデリング

オートパイロット機能を利用することで、複数のアルゴリズムを組み合わせた学習を一括で行うことができます。

④MLOpsによる本番運用

MLOpsによる本番運用

MLOpsを利用することで、簡単に予測ができたりAPIを発行できるため、本番運用までのステップが少なくすみます

DataRobotの価格と購入方法

DataRobotの価格は、多くの場合、企業ごとの見積もりになります。
年間ライセンスで数百万円~数千万円となることもある、高価なソフトウェアです。


引用:https://www.itis.nssol.nipponsteel.com/datarobot/solution/datarobot/free-trial/

日本でDataRobotを購入するためには、販売代理店である

  • 日鉄ソリューションズ
  • 伊藤忠テクノソリューションズ
  • NTTデータ

などの販売パートナーからの購入となります。
ネットで即購入できるものではないため、問い合わせをして購入してください。

販売パートナー:https://www.datarobot.com/jp/partners/value-added-resellers/

DataRobotを無料で使う方法

DataRobotは、有償のサービスですが、30日間の無料トライアルができるようになっています。
製品の価格が高いため、いきなり購入ではなく、トライアルをしてから購入することをおすすめします。
DataRobotの無料体験版は、下記のURLで登録ができます。
https://www.datarobot.com/jp/trial/

DataRobotの無料体験版

トライアルをするためには、名前、会社名とともにビジネスEメールアドレス等を入力して送信します。
暫く待つと登録したメールアドレス宛にメッセージが届き、メール内の「DataRobotを開始」のボタンを押すことでスタートできます。
DataRobot

DataRobotを使用する際にはサインインが必要となります。
先程登録した情報が入っていますので、パスワードを入力して開始するか、Googleアカウントを使ってサインインできます。

DataRobotのサインイン画面

DataRobotの使い方

サインインをすると、「お困りですか?DataRobotがお手伝いします」という表示とともに、どんなことを行いたいかを選択することができるようになります。

  • マイデータを準備する
  • インサイトを探索
  • AIモデルを作成する
  • デプロイと監視

DataRobotの使い方-1

今回は、「AIモデルを作成する」でスタートしましょう。
DataRobotでは、3段階でAIモデルを作成することができます。

「データプレパレーション」は、機械学習をするための学習データ(教師データ)を作成するためのモードです。
様々な企業データ(顧客データや売上データなど)をそのまま学習すると精度が上がらない場合があるため、データの前処理として欠損値を削除したり外れ値を除去したりといった作業ができます。

「機械学習の開発」は、準備したデータを学習するため、様々な機械学習アルゴリズムを利用して学習モデルを作成するフェーズです。
今までは様々なアルゴリズムを専門家が選定し、チューニングする必要がありましたが、AutoMLと呼ばれる自動化プログラムにより、チューニングの手間が非常に少なくなっています。

「機械学習の運用」では、学習済みのAIモデルを使用して、予測を行うための運用に関する設定を行うことができます。

DataRobot-予測を行うための運用に関する設定

「続ける」を押して進むと、データセットをインポートできます。
すぐにデータがない方は、下の「または、いくつかの一般的なユースケースを探索します」で選択できます。
今回は、「再入院」を使用してみましょう。

Datarobot-データセットをインポート

データをインポートすると、このような画面が出てきます。

データをインポート2

画面下には今回のデータに含まれる特徴量の一覧や、型、欠損値の有無などが表示されています。

データをインポート3

ターゲット、つまり、今回のデータから何を予測したいかを選択します。
今回は、様々なデータを元に、ある人が再入院の可能性があるかないかを予測するモデルを作成するため、「再入院」を選択します。
「開始」を押すことで学習を実行することができます。

Datarobot-再入院

開始するだけで、DataRobotの中ではデータの前処理と様々な機械学習アルゴリズムを組み合わせ、約40ものモデルを自動作成してくれます。

DataRobotの中ではデータの前処理と様々な機械学習アルゴリズムを組み合わせ、モデルを自動作成

データの各特徴量は、データの個数や分布を見るためのヒストグラム表示ができ、結果との関係性を見たり、どの特徴量が再入院の要因として有用性が高いのかを表示できます。

Datarobot-データの各特徴量

学習モデルは、上部の「モデル」で確認することができます。
右側にある「検定」や「交差検定」、「ホールドアウト」で精度を確認することができます。
より精度を高めるためには、右側の「精度を高める」でオートパイロットを再実行することで更に多くのモデルの学習を行うことができます。

Datarobot-オートパイロットを再実行

モデルをデプロイすると、学習済みモデルを使用した新しいデータの予測ができます。
今回の例ですと、ある新規の患者さんのデータを入れることで、その患者さんの再入院のリスクがあるかないかを予測できます。
「MLOps」でモデルを確認できます。

Datarobot-オートパイロットを再実行

新しいデータで予測する場合は、ソースとしてファイルをアップロードするだけで予測できます。

ファイルをアップロード

予測APIを発行することもできますので、このAPIにデータを渡すアプリケーションを作ったり、社内システムとの連携も簡単に行なえます。

予測APIを発行

DataRobotの高度で便利な機能

様々な企業データ(顧客データや売上データなど)をお持ちの方は、それを入れると簡単にAIが作成できると思われますが、そのまま学習しても精度が上がらない場合が多くあります。
人が見て、予測したいターゲットに対して関連性のない特徴量を削除したり、複数の特徴量を掛け合わせて新たな特徴量を作るなど、データの前処理が非常に重要になります。

「データプレパレーション」は、機械学習をするための学習データ(教師データ)を作成するためのモードで、上記のような作業を簡単に行うことができます。
この機能を活用することで、より精度の高いモデルを作成できるようになります。

データプレパレーション

DataRobotについてまとめ

今回は、DataRobotの価格や特徴から無料体験版の方法まで解説しました。
DataRobotを導入してみたいけどどういうものか分からない人は、ぜひこの記事の情報を参考にしてみてください。

最新情報をチェックしよう!