強化学習を用いたAIソリューション『 組合せ最適化ソリューション 』をリリースへ!

こんにちは!AI研究所の石川です。
本日のtopicsは、Laboro.AIがリリースした、強化学習を用いた「 組合せ最適化ソリューション 」をご紹介します。

オーダーメイドによるAI・人工知能ソリューション『カスタムAI』の開発・提供およびコンサルティング事業を展開する株式会社Laboro.AIは、強化学習を用いて機械自らが試行錯誤を通して、膨大な組み合わせの中から最適なものを選択するAIソリューション『組合せ最適化ソリューション』をリリースしました。

組合せ最適化ソリューションについて

組合せ最適化ソリューションは、大量の組合せの中から最も良いものを選択するという「組合せ最適化問題」を、強化学習技術を使って解決することを目指したAIソリューションです。
強化学習を用いることによって、一般的な最適化手法と比べて学習データを活用するため最適化に要する時間を短縮できること、問題依存のチューニングの手間を低減できることが見込まれ、工程スケジューリングや配達経路の最適化、アルバイトシフト計画や船舶の積荷配置計画の策定など、様々なビジネスシーンでの活用が期待できます。

「組合せ最適化問題」の具体例としては、調理工程スケジューリング、配達経路最適化、アルバイトのシフト計画、船舶の積荷配置計画、製造組立ラインでの工程スケジュールといったものがありますが、これらの組合せ最適化問題に強化学習を用いるメリットとして、一般的な最適化手法と比べて学習データを活用するため最適化に要する時間を短縮できること、問題依存のチューニングの手間を低減できることの2点が挙げられます。

組合せ最適化問題とは?

組合せ最適化問題とは、条件を満たす組合せの中からある値を最もよくするものを選択する問題です。ここでは、調理工程スケジューリング問題と配達経路選択問題を具体例に挙げて説明します。

調理工程スケジューリング問題

スケジューリング問題の例の一つに、調理工程の最適化があります。例えば、調理者1名が全部で4つの料理を作る場合には、各料理に“野菜を切る” “コンロで煮る”といった決められた調理手順があり、さらに調理器具としてコンロ、オーブン、包丁、まな板、炊飯器を1つずつ使用できることなどが想定されます。調理工程の最適化問題は、そうした制約条件のもとで、調理終了までの時間を最も短くする調理工程を選択する問題です。

制約条件を考慮すると、最適な調理工程は下図のようになります。この程度の大きさの問題なら簡単に解くことができる一方で、さらに多くの料理を多人数で作る場合などには、組合せの数が増え、より問題の難易度が上がっていくことになります。

配達経路最適化問題

配達経路選択問題の例の一つに、複数トラックでの配送ルートを決定する配達経路最適化問題が挙げられます。その問題設定は、配送対象の住宅に対して複数トラックで配送するという内容になり、制約条件としては、荷物のお届け日時の指定があるほか、トラックに一度に詰め込める荷物に制限があるといったことが考えられます。配達経路最適化問題は、そうした制約条件を満たして、配達時間を最小化する配達順序を決定する問題であり、配達対象の住宅の数が増え、トラックの台数も増えるなど、問題がより大きくなる場合には、最適化することが難しくなっていきます。

強化学習×最適化問題のメリット

強化学習とは、エージェントと呼ばれる主体が、試行錯誤を通して最適な行動を実現する機械学習手法の一つです。エージェントは、一連の行動を通して得られる報酬を最大化するように学習することで、自らの行動を最適化していきます。
最適化問題に強化学習を適用することのメリットとしては2点挙げられます。
1点目は、最適化問題が大きくなっても、強化学習では最適化に要する時間(推論時間)が大きくなりにくいという点です。強化学習では、学習データを元にして様々なパターンを機械が自動で学び、その学んだことを生かすことができるため、推論時に問題を解くためにかかる時間がそこまで長くならないことが期待でき、それを示す研究も報告されています。その結果、頻繁に状況が変わり、その度に最適化が必要になるような状況においては強化学習を適用する意味が出てくると考えられます。
2点目は、強化学習を用いると様々な最適化問題に対してほぼ一つの枠組みでアルゴリズムを構築することが可能になる点です。数理最適化アルゴリズムでは問題ごとに職人技による定式化やアルゴリズム開発が必要になることが多い一方、強化学習では共通したフレームワークや技法を使った上で、必要に応じて問題ごとにチューニングすることで対応できます。強化学習を適用するコツとしては、学習を促進する報酬の設計、最適化途中の価値関数の設計、高速なサンプリングのための実装上の工夫といった事があげられます。強化学習という同一の枠組みですが、ある程度の試行錯誤は必要となります。

組合せ最適化ソリューション提供のポイント

本ソリューションは汎用的にご利用いただけるAIプロダクトとして販売するものではなく、個社ごとにオーダーメイド開発することを通して提供します。
本ソリューションの提供においては、問題の性質や条件に合わせ、強化学習に加えて適宜、数理最適化の技術も応用しながら高いビジネス成果へとつなげていくことを目指します。なお、組合せ最適化問題を強化学習で解く前提として、シミュレータ環境の設計が必須になる場合があり、シミュレータ環境の実装方法、最適な技術選択、問題に応じた技法のチューニング等についても提案します。

活用シーン

本ソリューションは、以下のようなビジネスシーンでの活用が見込まれます。
・配送トラックの経路最適化
・アルバイトのシフト計画の策定
・船舶の積荷配置計画の策定
・製造組立ラインでの工程スケジュールの策定

ポイント

ソリューション提供に当たってのポイントは以下の通りです。

導入時のフルサポート

AI・機械学習技術は、導入の初期段階からに専門的知見が必要になり、導入ハードルが高い技術の一つです。
本ソリューションの提供に当たっては、当社独自人材であるソリューションデザイナによるコンサルティングを実施することを通して、ビジネス活用にあたっての議論やデータ選定の段階からフルサポートします。

最先端アルゴリズムの活用

アカデミア(学術界)の先端研究をキャッチアップした上で、求める成果に即した最適なアルゴリズムや手法を活用し、ビジネス成果につながるAIソリューションとして提供します。

開発・導入フロー

本ソリューションの開発・導入の標準的な流れは以下の図の通りです。なお、オーダーメイドという特性上、実際の開発フローはケースごとに異なります。

 

Laboro.AIがリリースした、強化学習により機械自らが試行錯誤を通して、膨大な組合せの中から最適なものを選択する『組合せ最適化ソリューション』に注目です!

最新情報をチェックしよう!