転移学習

転移学習とは

転移学習とは機械学習分野の技術で、別のタスクで学習された知識を新しいタスクの効果的な仮説を効率的に見つけ出すために転移する手法です。
よく用いられる転移学習の一種であるドメイン適応は、ある専門領域(ドメイン)で学習したモデルを別の領域に適合させるアルゴリズムです。

たとえば、ある畳み込みニューラルネットワークモデルに動物の画像データを大量に用いて識別タスクを学習させたとします。
次に、植物の画像データを学習させるようにしたとき、同じように植物の画像データを大量に用意する必要はありません。転移学習を用いると、動物の画像データを学習済みのモデルを転用して、少量の植物の画像データを学習させるだけで、植物の識別タスクが出来るようになります。

一般に、教師あり学習などでは大量のデータが必要で、また学習時間も膨大にかかります。
転移学習では、ターゲットドメインのサンプルの分布をソースドメインの分布に近付けることで、ソースドメインを使って学習した識別器をターゲットドメインに適用します。
転移学習で学習済みのモデルを転用することで、大量のデータと学習にかかる時間を大幅に削減することができます。

このような転移学習が可能なのは、学習済みのモデルがノード間の重み付けを再利用しており、モデルがすでに特定のドメインのパターン認識に必要な特徴量のポイントを抑えているからだと考えられます。


転移学習の類似の技術にはファインチューニングが知られています。両者には技術的な違いがあり、転移学習では既存の学習済モデルの重みデータを変更せずそのまま用いるのに対して、ファインチューニングでは既存の学習済モデルの重みデータの一部再学習を行います。
この再学習を行うことでファインチューニングではより汎化性能を上げることができます。また、マルチタスク学習も複数の課題をこなす方法ですが、転移学習と異なり、最初から単一のモデルで複数のドメインの課題を解くことを目指します。

機械学習を行う場合、大量のデータを用いて教師あり学習などを行うのが理想ですが、現実世界においてはつねに大量のデータが入手可能とは限りません。
また、全く新しいドメインの学習をする機会は限られているため、毎回のように膨大な学習時間をかける必要性もありません。学習時間が限られ、少量のデータしか得られない多くの一般的なケースにおいて、転移学習やファインチューニングは現実的で強力な解決策となり得るでしょう。

企業向けAI人材育成サービス

企業向けAI人材育成サービス

AI事業発足やAI導入に必要な人材育成のステップとAI研究所が提供するサービス。AI研究所の人材育成サービスでは、3つのステップを軸に御社の業務内でAIを活用できる人材育成やAIプロジェクトの支援を行います。

CTR IMG