DataRobotとは?無料で使う方法やDataRobotの使い方を徹底解説

DataRobotとは?

DataRobotは、AIを作成する際に必要になるPythonなどのプログラミング言語や専門知識を知らなくても、AIによるデータ分析や画像認識、数値予測などを行え、自社の業務で活用できるAIを作成できる機械学習プラットフォームです。
https://www.datarobot.com/jp/

通常、AIを作成する際にはPythonを利用したプログラミングが必要であったり、機械学習のアルゴリズムを理解する必要があるなど、技術的なハードルが高い側面があります。
DataRobotを使うと、ノンプログラミングでAIを構築することができます。

DataRobotのスペックまとめ

価格数百万円~数千万円
インストール環境パブリッククラウド、プライベートクラウド、オンプレミス
データ準備ファイル読み込み、データベース読み込み、自動特徴量探索
モデリング分類、回帰、画像、異常値検知、時系列
デプロイAPI発行、精度・ドリフト監視、予測コード書き出し

DataRobotの主な特徴まとめ

DataRobotの主な特徴について解説します。

特徴1:簡単かつ自動で、最適な機械学習モデルを作成できる

データを読み込んで「開始」とクリックするだけで、1,000を超えるアルゴリズムの中から最適な手法を組み合わせて学習するステップを自動的に処理してくれます。
機械学習の知識がなくても使うことができます。

特徴2:時間のかかるデータの前処理の時間を削減できる


AIプロジェクトの7割~9割がデータの前処理に時間がかかると言われるほど、機械学習モデルを作成する場合にデータの前処理の作業負担は大きいです。データ前処理のツールを持っているため、時間を大幅に削減できます。

特徴3:学習済みモデルの運用まで自動化できる


学習をするだけではなく、学習済みモデルをデプロイし、本番運用にそのまま使用することができます。大規模なシステム化を行わなくても、本番環境ですぐに実務運用ができるようになります。

DataRobotの主な機能まとめ

DataRobotの主な機能について解説します。

機能1:データの前処理


Paxataと呼ばれる、データの前処理を行うツールが備わっているため、Excelのような感覚でデータの処理を行うことができます。

機能2:データの特徴の確認


データの数や欠損値の有無、平均値や中央値などの統計的な情報、ヒストグラム表示など、データを分析するための機能がついています。

機能3: オートパイロットによる自動モデリング


オートパイロット機能を利用することで、複数のアルゴリズムを組み合わせた学習を一括で行うことができます。

機能4: MLOpsによる本番運用


MLOpsを利用することで、簡単に予測ができたりAPIを発行できるため、本番運用までのステップが少なくてすみます。

DataRobotの価格と購入方法

DataRobotの価格は、多くの場合企業ごとの見積もりになります。年間ライセンスで数百万円~数千万円となることもある、高価なソフトウェアです。

引用:https://www.itis.nssol.nipponsteel.com/datarobot/solution/datarobot/free-trial/

日本でDataRobotを購入するためには、販売代理店である日鉄ソリューションズや、伊藤忠テクノソリューションズ、NTTデータなどの販売パートナーからの購入となります。ネットで即購入できるものではないため、問い合わせをして購入してください。

販売パートナー
https://www.datarobot.com/jp/partners/value-added-resellers/

DataRobotを無料で使う方法

DataRobotは、有償のサービスですが、14日間の無料トライアルができるようになっています。製品の価格が高いため、いきなり購入ではなく、トライアルをしてから購入することをおすすめします。
DataRobotの無料体験版は、下記のURLで登録ができます。
https://www.datarobot.com/jp/trial/

トライアルをするためには、名前、会社名とともにビジネスEメールアドレス等を入力して送信します。暫く待つと登録したメールアドレス宛にメッセージが届き、メール内の「DataRobotを開始」のボタンを押すことでスタートできます。

DataRobotを使用する際にはサインインが必要となります。
先程登録した情報が入っていますので、パスワードを入力して開始するか、Googleアカウントを使ってサインインできます。

DataRobotの使い方

サインインをすると、「お困りですか?DataRobotがお手伝いします」という表示とともに、どんなことを行いたいかを選択することができるようになります。
「マイデータを準備する」
「インサイトを探索」
「AIモデルを作成する」
「デプロイと監視」

今回は、「AIモデルを作成する」でスタートしましょう。
DataRobotでは、3段階でAIモデルを作成することができます。
「データプレパレーション」は、機械学習をするための学習データ(教師データ)を作成するためのモードです。様々な企業データ(顧客データや売上データなど)をそのまま学習すると精度が上がらない場合があるため、データの前処理として欠損値を削除したり外れ値を除去したりといった作業ができます。
「機械学習の開発」は、準備したデータを学習するため、様々な機械学習アルゴリズムを利用して学習モデルを作成するフェーズです。今までは様々なアルゴリズムを専門家が選定し、チューニングする必要がありましたが、AutoMLと呼ばれる自動化プログラムにより、チューニングの手間が非常に少なくなっています。
「機械学習の運用」では、学習済みのAIモデルを使用して、予測を行うための運用に関する設定を行うことができます。

「続ける」を押して進むと、データセットをインポートできます。
すぐにデータがない方は、下の「または、いくつかの一般的なユースケースを探索します」で選択できます。今回は「再入院」を使用してみましょう。

データをインポートすると、このような画面が出てきます。

画面下には今回のデータに含まれる特徴量の一覧や、型、欠損値の有無などが表示されています。

ターゲット、つまり、今回のデータから何を予測したいかを選択します。今回は、様々なデータを元に、ある人が再入院の可能性があるかないかを予測するモデルを作成するため、「再入院」を選択します。
「開始」を押すことで学習を実行することができます。

開始するだけで、DataRobotの中ではデータの前処理と様々な機械学習アルゴリズムを組み合わせ、約40ものモデルを自動作成してくれます。


データの各特徴量は、データの個数や分布を見るためのヒストグラム表示ができ、結果との関係性を見たり、どの特徴量が再入院の要因として有用性が高いのかを表示できます。

学習モデルは、上部の「モデル」で確認することができます。
右側にある「検定」や「交差検定」、「ホールドアウト」で精度を確認することができます。より精度を高めるためには、右側の「精度を高める」でオートパイロットを再実行することで更に多くのモデルの学習を行うことができます。

モデルをデプロイすると、学習済みモデルを使用した新しいデータの予測ができます。今回の例ですと、ある新規の患者さんのデータを入れることで、その患者さんの再入院のリスクがあるかないかを予測できます。
「MLOps」でモデルを確認できます。

新しいデータで予測する場合は、ソースとしてファイルをアップロードするだけで予測できます。

予測APIを発行することもできますので、このAPIにデータを渡すアプリケーションを作ったり、社内システムとの連携も簡単に行なえます。

DataRobotの高度な機能・便利な機能

様々な企業データ(顧客データや売上データなど)をお持ちの方は、それを入れると簡単にAIが作成できると思われますが、そのまま学習しても精度が上がらない場合が多くあります。
人が見て、予測したいターゲットに対して関連性のない特徴量を削除したり、複数の特徴量を掛け合わせて新たな特徴量を作るなど、データの前処理が非常に重要になります。

「データプレパレーション」は、機械学習をするための学習データ(教師データ)を作成するためのモードで、上記のような作業を簡単に行うことができます。

この機能を活用することで、より精度の高いモデルを作成できるようになります。

最新情報をチェックしよう!
企業向けAI人材育成サービス

企業向けAI人材育成サービス

AI事業発足やAI導入に必要な人材育成のステップとAI研究所が提供するサービス。AI研究所の人材育成サービスでは、3つのステップを軸に御社の業務内でAIを活用できる人材育成やAIプロジェクトの支援を行います。

CTR IMG