AIの進化により、データサイエンスの領域でも高度な分析を簡単に行えるツールが求められています。そんな中、DataRobotは自動機械学習プラットフォームとして注目を集めています。DataRobotを使えば、複雑なデータ分析やモデル作成を迅速に行うことができ、データサイエンティストだけでなく、ビジネスユーザーにも使いやすい環境を提供します。
本記事では、DataRobotの基本的な概要から、特徴、機能、さらには無料で利用する方法までを徹底解説します。これからAIを活用したデータ分析に取り組もうと考えている方にとって、必見の内容です。
DataRobotとは?
DataRobotは、AIを作成する際に必要になるPythonなどのプログラミング言語や専門知識を知らなくても、AIによるデータ分析や画像認識、数値予測などを行え、自社の業務で活用できるAIを作成できる機械学習プラットフォームです。
通常、AIを作成する際にはPythonを利用したプログラミングが必要であったり、機械学習のアルゴリズムを理解する必要があるなど、技術的なハードルが高い側面があります。
DataRobotを使うと、ノンプログラミングでAIを構築することができます。
さらに、AIについて詳しく知りたい方は、以下の記事をご覧ください。
DataRobotのスペック
DataRobotの成功は、その優れたスペックにあります。多くのデータを迅速に処理し、複数の機械学習モデルを同時に生成できるそのパフォーマンスは、データサイエンスの現場で非常に重宝されています。対応可能なデータの形式やその処理速度、クラウドやオンプレミスへの対応など、DataRobotのスペックは、多様なニーズに応えるべく設計されています。
価格 | 数百万円~数千万円 |
インストール環境 | パブリッククラウド、プライベートクラウド、オンプレミス |
データ準備 | ファイル読み込み、データベース読み込み、自動特徴量探索 |
モデリング | 分類、回帰、画像、異常値検知、時系列 |
デプロイ | API発行、精度・ドリフト監視、予測コード書き出し |
DataRobotの特徴
DataRobotの以下3つの主な特徴について解説します。
- 簡単かつ自動で、最適な機械学習モデルを作成できる
- 時間のかかるデータの前処理の時間を削減できる
- 学習済みモデルの運用まで自動化できる
①簡単かつ自動で、最適な機械学習モデルを作成できる
データを読み込んで「開始」とクリックするだけで、1,000を超えるアルゴリズムの中から最適な手法を組み合わせて学習するステップを自動的に処理してくれます。
機械学習の知識がなくても使うことができます。
②時間のかかるデータの前処理の時間を削減できる
AIプロジェクトの7割~9割がデータの前処理に時間がかかると言われるほど、機械学習モデルを作成する場合にデータの前処理の作業負担は大きいです。
データ前処理のツールを持っているため、時間を大幅に削減できます。
③学習済みモデルの運用まで自動化できる
学習をするだけではなく、学習済みモデルをデプロイし、本番運用にそのまま使用することができます。
大規模なシステム化を行わなくても、本番環境ですぐに実務運用ができるようになります。
さらに、機械学習について詳しく知りたい方は、以下の記事をご覧ください。
DataRobotの機能
DataRobotの以下4つの主な機能について解説します。
- データの前処理
- データの特徴の確認
- オートパイロットによる自動モデリング
- MLOpsによる本番運用
①データの前処理
Paxataと呼ばれる、データの前処理を行うツールが備わっているため、Excelのような感覚でデータの処理を行うことができます。
②データの特徴の確認
データの数や欠損値の有無、平均値や中央値などの統計的な情報、ヒストグラム表示など、データを分析するための機能がついています。
③オートパイロットによる自動モデリング
オートパイロット機能を利用することで、複数のアルゴリズムを組み合わせた学習を一括で行うことができます。
④MLOpsによる本番運用
MLOpsを利用することで、簡単に予測ができたりAPIを発行できるため、本番運用までのステップが少なくすみます。
DataRobotの価格と購入方法
DataRobotの価格は、多くの場合、企業ごとの見積もりになります。
年間ライセンスで数百万円~数千万円となることもある、高価なソフトウェアです。
引用:https://www.itis.nssol.nipponsteel.com/datarobot/solution/datarobot/free-trial/
日本でDataRobotを購入するためには、販売代理店である
- 日鉄ソリューションズ
- 伊藤忠テクノソリューションズ
- NTTデータ
などの販売パートナーからの購入となります。
ネットで即購入できるものではないため、問い合わせをして購入してください。
販売パートナー:https://www.datarobot.com/jp/partners/value-added-resellers/
DataRobotを無料で使う方法
DataRobotは、有償のサービスですが、30日間の無料トライアルができるようになっています。
製品の価格が高いため、いきなり購入ではなく、トライアルをしてから購入することをおすすめします。
- DataRobot AI Platform無料トライアル開始
- DataRobot AI Platformフリートライアルの登録
- DataRobot AI Platformへのサインイン
DataRobot AI Platform無料トライアル開始
DataRobotの無料体験版は、下記のURLで登録ができます。
https://www.datarobot.com/jp/trial/
DataRobot AI Platformフリートライアルの登録
トライアルをするためには、名前、会社名とともにビジネスEメールアドレス等を入力して送信します。
暫く待つと登録したメールアドレス宛にメッセージが届き、メール内の「DataRobotを開始」のボタンを押すことでスタートできます。
DataRobot AI Platformへのサインイン
DataRobotを使用する際にはサインインが必要となります。
先程登録した情報が入っていますので、パスワードを入力して開始するか、Googleアカウントを使ってサインインできます。
DataRobotの使い方
DataRobotの使い方は非常にシンプルで、初心者でも短時間で基本操作をマスターできます。データのインポートからモデルの作成、そして予測結果の取得まで、わかりやすいインターフェースを通じて直感的に操作できます。ここでは、具体的な操作手順をステップバイステップで紹介します。
- DataRobotへのサインイン
- DataRobotのAIモデル作成開始
- データセットのインポート
- ターゲットの選択と開始
- 学習モデルの詳細確認
- 学習モデルのデプロイ
DataRobotへのサインイン
サインインをすると、「お困りですか?DataRobotがお手伝いします」という表示とともに、どんなことを行いたいかを選択することができるようになります。
- マイデータを準備する
- インサイトを探索
- AIモデルを作成する
- デプロイと監視
今回は、「AIモデルを作成する」でスタートしましょう。
DataRobotのAIモデル作成開始
DataRobotでは、3段階でAIモデルを作成することができます。
「データプレパレーション」は、機械学習をするための学習データ(教師データ)を作成するためのモードです。
様々な企業データ(顧客データや売上データなど)をそのまま学習すると精度が上がらない場合があるため、データの前処理として欠損値を削除したり外れ値を除去したりといった作業ができます。
「機械学習の開発」は、準備したデータを学習するため、様々な機械学習アルゴリズムを利用して学習モデルを作成するフェーズです。
今までは様々なアルゴリズムを専門家が選定し、チューニングする必要がありましたが、AutoMLと呼ばれる自動化プログラムにより、チューニングの手間が非常に少なくなっています。
「機械学習の運用」では、学習済みのAIモデルを使用して、予測を行うための運用に関する設定を行うことができます。
「続ける」を押して進むと、データセットをインポートできます。
データセットのインポート
データセットをインポートを開始します。
すぐにデータがない方は、下の「または、いくつかの一般的なユースケースを探索します」で選択できます。
今回は、「再入院」を使用してみましょう。
データをインポートすると、このような画面が出てきます。
画面下には今回のデータに含まれる特徴量の一覧や、型、欠損値の有無などが表示されています。
ターゲットの選択と開始
ターゲット、つまり、今回のデータから何を予測したいかを選択します。
今回は、様々なデータを元に、ある人が再入院の可能性があるかないかを予測するモデルを作成するため、「再入院」を選択します。
「開始」を押すことで学習を実行することができます。
開始するだけで、DataRobotの中ではデータの前処理と様々な機械学習アルゴリズムを組み合わせ、約40ものモデルを自動作成してくれます。
データの各特徴量は、データの個数や分布を見るためのヒストグラム表示ができ、結果との関係性を見たり、どの特徴量が再入院の要因として有用性が高いのかを表示できます。
学習モデルの詳細確認
学習モデルは、上部の「モデル」で確認することができます。
右側にある「検定」や「交差検定」、「ホールドアウト」で精度を確認することができます。
より精度を高めるためには、右側の「精度を高める」でオートパイロットを再実行することで更に多くのモデルの学習を行うことができます。
学習モデルのデプロイ
モデルをデプロイすると、学習済みモデルを使用した新しいデータの予測ができます。
今回の例ですと、ある新規の患者さんのデータを入れることで、その患者さんの再入院のリスクがあるかないかを予測できます。
「MLOps」でモデルを確認できます。
新しいデータで予測する場合は、ソースとしてファイルをアップロードするだけで予測できます。
予測APIを発行することもできますので、このAPIにデータを渡すアプリケーションを作ったり、社内システムとの連携も簡単に行なえます。
DataRobotの高度で便利な機能
様々な企業データ(顧客データや売上データなど)をお持ちの方は、それを入れると簡単にAIが作成できると思われますが、そのまま学習しても精度が上がらない場合が多くあります。
人が見て、予測したいターゲットに対して関連性のない特徴量を削除したり、複数の特徴量を掛け合わせて新たな特徴量を作るなど、データの前処理が非常に重要になります。
「データプレパレーション」は、機械学習をするための学習データ(教師データ)を作成するためのモードで、上記のような作業を簡単に行うことができます。
この機能を活用することで、より精度の高いモデルを作成できるようになります。
DataRobotについてまとめ
DataRobotは、データサイエンスをより簡単に、そして効率的にするための強力なツールです。その自動化機能と多様なアルゴリズム対応により、幅広い業界で利用されています。
本記事を通じて、DataRobotの基本的な特徴や機能、そして活用方法について理解を深め、ビジネスに活用するためのヒントを得ていただけたのではないでしょうか。今後のデータ分析において、DataRobotを活用することで、より迅速かつ的確な意思決定が可能になるでしょう。