
こんにちは!AI研究所の見習い研究員Chisatoです。
本日のtopicsは、Proxima Technologyが提供開始した、非常に少ないデータから操作法を学習できる制御AI「Smart MPC」をご紹介します。
製造業を中心に様々なAIシステム開発を手掛ける、株式会社 Proxima Technologyは、非常に少ないデータ・体験から操作法を学習できる制御AI「Smart MPC」を2021年2月8日より提供開始しました。
背景
現在多くのプラントや機械の制御にはPID制御と呼ばれる方法が使われています。PIDは比較的直観的で現場の作業者にとっても調整が可能である一方で、以下のようなの欠点を持ちます。
・むだ時間に弱くオーバーシュートやハンチングが起きやすい
・SISO(一入力一出力)系しか扱えない
・拘束条件が扱えない
・最適化できない
これらは、ものによっては致命的な問題で、制御システムの開発を著しく難しており、PIDのパラメータの調整だけでも多くの時間を浪費してしまうといった状況が各所で見られます。
一方で、強化学習の一部は人間の能力を超えた成績を出せるようになってきてはいますが、その学習には膨大なデータが必要であり、学習自体も非常に不安定で再現性に乏しく、少なくとも現時点では産業利用にはとても向かないといった欠点をもっています。
そこで、Smart MPC はモデル予測制御と呼ばれる制御法と機械学習を組み合わせることにより、上記の2つの手法の欠点をすべて解決することが出来ました。
「Smart MPC」特徴
Smart MPCは、体験から学習し、自発的に操作法を憶えます。PID制御より賢く、強化学習より実用的なアルゴリズムです。
1. むだ時間に強い
未来の状態(予測)に基づいた適切なフィードバック制御ができます。
2. 学習が早く、安定している
少数データでも学習が可能であり、学習結果も安定しています。
学習も簡単で、パラメータの調整の手間も非常に少ないです。
3. 計算量が小さい
制御対象によってはRaspberry PiのCPUでも動くほど軽量です。
4. その他3つの特徴
・ MIMO(多入力多出力)系が扱える
・ 拘束条件が扱える
・ 最適化ができる
Smart MPCを用いた倒立振子の制御の様子
強化学習(DQN)では数百エピソードを必要としますが、Smart MPCなら一桁エピソードで収束します。
PID制御より賢く、強化学習より実用的なアルゴリズムとして、体験から操作法を学習できる制御AI「Smart MPC」に注目です!