教師あり学習と教師なし学習の違いと種類まとめ

AIの機械学習には大きく分けて教師あり学習と教師なし学習という種類が存在します。それぞれ特徴が異なっていて、AIを作る際に正しく理解していることが大切です。そこで、この記事では教師あり学習と教師なし学習の違いや種類について紹介しましょう。

教師あり学習の特徴と種類

教師あり学習の特徴や種類についてまとめました。

教師あり学習はAIにあらかじめ問題と答えを教える方法

教師あり学習とは、人間が問題と答えのデータを与えて、AIがそのデータを分析して問題から正しい答えを導き出せるようにパラメータを自動調整するという仕組みです。

たとえば、画像認識の学習をさせるケースを考えましょう。この場合は、人の顔や車、犬といった画像を入力データとして与えて、なおかつその画像の正しい答え(ラベル)も同時に与えるのです。そうすれば、AIは入力として与えられた画像のデータを学習して、未知の画像が入ってきた場合にも正しい答えを予測できるようにパラメータを調整します。

与えられた答えをもとにAI(機械)がパラメータを自動調整するため、「機械学習」と呼ばれています。

教師あり学習には回帰と分類という種類がある

教師あり学習には主に回帰と分類という手法があります。

回帰とは連続した数値を予測することです。たとえば、不動産の住宅規模データを与えられたときに、販売価格を予測することです。

分類とは、あるデータを与えられたときに、それがどのクラスに属するものかを予測することです。たとえば、送られたきたメールを迷惑メールかそうでないかと分類するといったケースに役立ちます。

教師あり学習の利点

教師あり学習は、多くのデータとそれに対応する答えを与えることで、正しい答えを予測できるようになるという利点があります。特に近年のAIブームは画像認識から始まっているのですが、人間がある画像に対して、「この画像はこのあたりの特徴からしてネコが写っている」というふうに分析を行い、結果を出すためのプログラムを作るのは非常に手間がかかります。AIを用いると、画像のデータ分析をコンピュータに任せることが可能になり、良質なデータでトレーニングを受けたAIであれば、人間と同じか、それ以上にデータの分類などを行わせることができます。

データを与えられて正確に答えを導き出せるような問題については、教師あり学習はとても有用です。たとえば、工場における機械の故障を予測するといったケースに適しています。過去のデータを分析すれば、どのような条件で機械が故障するのかある程度正確なことがわかっているからです。

教師なし学習の特徴と種類

教師なし学習の特徴と種類について説明します。

教師なし学習は正解となるデータを与えない

教師なし学習では正解となるデータは与えません。入力データのみを与えてトレーニングさせるのが特徴です。データを与えるとAIが構造や特徴を分析して、グループ分けをしたり、データの簡略化を図ったりします。

教師なし学習の場合は、単にデータをグループ分けするだけであり、それぞれのグループの意味付けをAIが行うことはできません。そのため、最終的な結果の解釈については人間がする必要があります。

教師なし学習のアルゴリズムの種類について

教師なし学習にもさまざまな形態が存在しています。教師なし学習で採用されるアルゴリズムとして主に下記の4種類があるのです。

  • クラスタリング
  • 異常検知
  • 次元削減

クラスタリングとは、データ間にみられる類似度に基づきグループ分けをする方法です。クラスタリングにはさらに階層的クラスタリングと非階層的クラスタリングといった種類があります。たとえば、マーケティングのための調査結果をクラスターわけしてさまざまな要素に細分化するためにクラスタリングが用いられるのです。

異常検知とは、データの中の異常値を見つける方法です。異常な値は多岐に渡ることが多いため、異常なパターンをすべて表現することは難しいことがあります。そのため、異常検知では、正常なデータだけを学習させてそれ以外を異常と判定できるように学習を行います。

次元削減とはたくさんの次元のデータをよりわかりやすい低次元のデータに要約するというものです。教師あり学習の前処理として次元を減らすことで精度を向上させるなどの用途で使用されます。

教師なし学習の事例

教師なし学習はさまざまな場面で用いられています。

たとえば、異常検知のためのモデルを作成するのに教師なし学習は最適です。モデルが正常な場合よりどのくらい逸脱しているのかをデータ分析して異常度の判定ができます。過去に異常が発生した事例が少ない場合は教師あり学習よりも教師なし学習の方が適しているのです。

画像認識では、ラベルのついていない大量の画像データを学習させることで、特定の画像に強く反応するようなニューロンを作り出すという事例があります。

自動運転の開発においても活用されています。グループ化の精度を高めることで、膨大な量のラベリングされたデータを与えないでも対象を認識するモデルを構築できるのです。

教師あり学習と教師なし学習の違い

それぞれの手法の違いについて説明します。

コンピュータに与えるデータにラベルを付けるかどうかの違い

教師あり学習と教師なし学習の違いは機械学習の際に与えるデータにラベルを付けるかどうかです。ラベルとは、たとえば犬の画像に対して、この画像は「犬」であると指定することです。

正解のない問題では教師なし学習しか選択できない

教師あり学習はデータにラベルを付けることを前提とします。そのため、そもそも正解の存在しない問題については教師あり学習を選択できないのです。

たとえば、未来予測や傾向分析といった分野については正解は存在しません。大量のデータが存在していて、そこから傾向や分析を導き出してもらいたいときに教師なし学習は有効です。この場合、得られた結果に対して最終的に人間が正解を求めます。

教師あり学習と教師なし学習を使い分けることが大切

機械学習の方法として教師あり学習と教師なし学習という2つの方法があり、これらはどちらの方が優れているかという問題ではありません。それぞれに一長一短があり、得意とする分野は異なっているのです。そのため、これからAIに機械学習をさせる際には、解決したい問題について最適な手法を選択しましょう。

実際には教師あり学習と教師なし学習を組み合わせるという事例もあります。教師なし学習によって傾向分析を行い精度の高い結果を正解として採用して、その正解をラベルとしてあらためて教師あり学習をするのです。これによって、より精度の高いモデルを作成できます。

まとめ

教師あり学習と教師なし学習はAIに学習させるための手法です。ラベルの付いたデータを与えるかどうかの違いであり、それぞれに長所があります。これからAIを作る際には目的に合わせて使い分けると良いでしょう。

最新情報をチェックしよう!
企業向けAI人材育成サービス

企業向けAI人材育成サービス

AI事業発足やAI導入に必要な人材育成のステップとAI研究所が提供するサービス。AI研究所の人材育成サービスでは、3つのステップを軸に御社の業務内でAIを活用できる人材育成やAIプロジェクトの支援を行います。

CTR IMG