AI研究所 - AI(人工知能)に脅かされないために、AI(人工知能)を作る側の人間になる -

HOME  >  ディープラーニングの統合開発環境「Neural Network Console クラウド版」にて分散学習環境の提供を開始へ!

公開日:2020.08.03 

ディープラーニングの統合開発環境「Neural Network Console クラウド版」にて分散学習環境の提供を開始へ!

AI(人工知能)のニュース

こんにちは!AI研究所の見習い研究員のChisatoです。
本日は、「Neural Network Console クラウド版」の分散学習に関するtopicsです。

ソニーは、ディープラーニング(深層学習)のプログラムを生成できる統合開発環境「コンソールソフトウェア:Neural Network Console クラウド版」において、複数のノードを利用して膨大な計算を可能にする分散学習環境の提供を、2020年7月30日より開始しました。

高速学習サービス「Neural Network Consoleクラウド版」について

ソニーは、2017 年6 月にディープラーニング開発のためのコアライブラリ「Neural Network Libraries」をオープンソース化し、同年8月にコンソールソフトウェア「Neural Network Console」の提供を開始しました。また、2018 年5 月からは複数GPU による高速学習サービス「Neural Network Consoleクラウド版」の提供を開始し、ウェブブラウザーでアクセスするだけで、GUIベースの直観的な操作画面やクラウド上のリソースを使用した本格的なディープラーニングのプログラム開発ができる統合開発環境を提供しています。
さらに、2019 年4 月よりクラウド版のGPU として、国立研究開発法人 産業技術総合研究所(以下:産総研)が構築・運用する世界最大規模のAI 処理向け計算インフラストラクチャであるAI 橋渡しクラウド(AI BridgingCloud Infrastructure、以下「ABCI」)」の選択ができるようになりました。

Neural Network Libraries
Neural Network Consoleクラウド版

「Neural Network Console クラウド版」分散学習について

このたび、「Neural Network Console クラウド版」の学習・評価で利用できる「ABCI」の計算ノードにおいて、複数のノード(マルチノード)による分散学習に対応します。これまで1つの学習処理あたりで利用できる計算ノードは1 台(4GPU)が最大でしたが、今後は最大16 台(64GPU)の利用が可能になります。
これにより、従来は一部の研究者などが利用してきた大規模なAI 開発環境を、一般のユーザーがGUI を介して手軽に利用できるようになります。

分散学習が実現できるサービスとは

ディープラーニングとは、人間の脳を模倣したニューラルネットワークを用いた機械学習の一手法です。これを使用することで画像認識や音声認識の性能が近年飛躍的に向上しています。
一方で、認識精度を向上させるために学習データのサイズやモデルのパラメーター数が増加し、計算時間が飛躍的に増加して、一度の学習に数週間から数カ月を要するケースもでてきました。AI 開発においては様々な試行錯誤を繰り返す必要があるため、学習時間の短縮は非常に重要となります。そのため、複数のGPU を活用した分散学習による開発の効率化が現在脚光を浴びています。
ソニーは、産総研が2018 年10 月に実施した「ABCI グランドチャレンジ」にて当時世界最速となる学習速度を達成するなど、かねてより分散学習の研究開発に取り組んできました。これらの知見をもとに、学習高速化の様々な技術をユーザーが使いやすいGUIの形にし、誰もが大規模な分散学習を実現できるサービスとして提供を始めました。

マルチノード分散学習の主な特長

「Neural Network Console クラウド版」における、膨大な計算を可能にする分散学習環境の特長をご紹介します。

1.“GUI×分散学習”で大規模なAI 開発環境を実現

直感的でわかりやすいGUI を通じたニューラルネットワーク設計ができるディープラーニング開発環境において、新たにマルチノードによる分散学習の実行に対応しました。
これまで一部の研究者などが利用していた高度な計算環境を、一般のユーザーが自身のPC からウェブインターフェースを介して、手軽に操作できるようになります。

2.複数ノードの割り当てが手軽にできるユーザーインターフェース

ノード数を選択しボタンをクリックするだけで分散学習の利用が可能です。
大量のデータを用いた複雑な学習を実行する場合も、内容に応じてノード数を選択することで柔軟に処理性能の上限をコントロールできます。オンデマンドでクラウド環境のリソースを利用することで、一時的な計算環境構築のための費用削減とともに、柔軟な学習環境での効率的な開発が可能です。

3.最大16の計算ノードを利用可能、演算処理が飛躍的に速く

ノード数は、4台、8台、16台の3種類から選択できます。
「Neural Network Console クラウド版」では、これまで1つの学習処理あたりで利用できる計算ノードは1台が最大でしたが、今回、最大16台の利用が可能となり、演算処理が飛躍的に速くなります。

利用料金について

太枠内が今回新たに提供するメニューです。

本格的なディープラーニングのプログラム開発ができる統合開発環境「Neural Network Console クラウド版」における、分散学習環境サービスに注目です!


参考になったら「いいね!」と「シェア」をお願いします!!

このエントリーをはてなブックマークに追加
AI(人工知能)セミナー開催中