機械学習の種類と特徴、仕組みまとめ

近年、脚光を浴びている「AI」や「ディープラーニング」などのITテクノロジーは、長年「機械学習」と呼ばれる分野で研究されてきたテクノロジーです。
この記事では、機械学習について調べている方に向けて、種類や特徴、仕組みについてわかりやすく紹介していきます。

機械学習の種類は大まかに3つ

機械学習を行うための技法やアルゴリズムは、現在は研究が進んだ結果、大量に存在しています。しかし、これらの技法・アルゴリズムを分類すると、大まかには3つの種類に整理可能です。具体的には「教師あり学習」と「教師なし学習」、そして「強化学習」があります。それぞれに学習における得意・不得意があるため、ケースバイケースで最適な種類を選ぶことが大切です。

教師あり学習は正誤判断が得意

教師あり学習は、コンピュータに正解を教えるのが最大の特徴です。
コンピュータは何をすれば良いのかを教えてもらえるため、判断の精度が高まり、学習速度も向上します。
「コンピュータに正解を教える」というとイメージしづらいかもしれませんが、具体的には「入力データ」とそれに対応する「答えラベル」を与えます。
例えば、画像認識のAIを作るなら、大量のひまわりの画像を「入力データ」として、それがひまわりであるという「答えラベル」をセットにしたデータ(教師データ)を用意し、同様に彼岸花、キクなどというセットを複数用意することで学習をしてくれます。
このタイプは、正誤がはっきりと分別できるシチュエーションにおいて、特に効果的とされます。
具体的には、システムのエラーを検知したり、迷惑メールを判定したりするのが得意です。
近年のAIブームは画像からスタートしているため、現在では、以下のような場面で役立っています。

  • 画像認識における画像検索アプリ
  • 株価の価格変動シミュレート
  • 製造業などにおける不良品検知

教師なし学習では意外な発見が多い

教師なし学習では、コンピュータに対して「答えラベル」にあたる正誤の判断基準を教えず、入力データのみを利用して学習させます。
コンピュータは入力データのみを利用し、どのような傾向や法則があるか、どんなグループに分類できるかなどを判断するわけです。
人間がつけた「答えラベル」を与えていないため、出てきた結果をチェックして分析・判断するのは人間が行います。
そのため、我々にとって意外な学習成果を得られる可能性も高くなります。例えば、顧客の年齢や性別、これまでの購入履歴と言った情報を与えたとしましょう。
コンピュータは、これらの顧客情報から、「どのような人物が、何を好むのか」などのパターンを割り出していきます。
その結果を見ると、人間が思ってもみなかった傾向が浮かび上がってくることがあるわけです。現在は、下記のような分野で開発が進んでいます。

  • マーケティングにおける顧客分析
  • 工業デザインの類似チェック
  • 教師あり学習に入れるための教師データ作成

強化学習はベストな「行動」を追求するのに有利

コンピュータの処理結果に対して正誤ではなく、点数による評価を利用して、「どう行動するとベストなのか」を学習するのが強化学習の特徴です。
教師なし学習と同じく、コンピュータは正誤による判断基準を用いませんが、代わりに何をすれば高得点を得られるかを学び、成果を最大化していきます。例えば、道路の信号機の操作をさせたとしましょう。
人や車の流れがスムーズで事故が少ないほど、高得点を与えます。
すると、コンピュータはできるだけ高得点を得られるよう、いつ、どのようなタイミングで信号機を切り替えるのがベストなのかを分析していくわけです。この特徴を活かして、具体的には以下のような用途があります。

  • 自動運転車やロボットの制御プログラム
  • 囲碁などのゲーム用AI

機械学習の特徴とは?AIやディープラーニングとの違いも紹介

機械学習の特徴を把握するには、AIやディープラーニングとの違いを確認することが大切です。これらの言葉は混同されがちですが、それぞれに異なる意味を持ちます。まず、AIは人工知能全般を意味する言葉です。人に近づけるような知能の研究も含まれるため、脳科学や哲学などにも広がる広い概念です。機械学習はAIのうち、コンピュータが自律的に学習していく研究の分野で、現在活用されているAIはほとんどが機械学習によって学習されています。そして、ディープラーニングは機械学習の中の1アルゴリズムであるニューラルネットワークを強化した概念で、ブレークスルーを起こしたテクノロジーです。今までコンピュータが苦手としてきた画像などの曖昧なものの認識ができるようになったことから、注目を集めています。

最初に、AIについて解説していきます。簡単なものでは、洗濯機についている、「おまかせモード」のような、簡単なプログラミングもAIの一種です。このモードは自動で洗濯物の体積などを分析し、最適な水量や洗濯時間を割り出します。しかし、洗濯機のAIは今のところ、新しい物事を学習することはありません。もし、AIが洗濯物の種類を分析し、最適な洗い方を学習できれば、より優れた成果が得られるはずです。機械学習は、このような考えのもとで誕生しました。

AIの歴史上、機械学習の登場は革新的なできごとの一つです。これまでは、例えばAIとチャットで会話する場合、表現のブレや曖昧さに対応するのは不可能でした。人間だと「速度超過」や「スピードオーバー」、「制限速度違反」はいずれも同じ意味だと解釈できますが、AIにとっては全て別の言葉だったのです。当時の技術では融通が利かず、予め3つとも教えていないと対応できませんでした。

ところが、機械学習の技術により、ある程度の表記のブレや曖昧さがあっても、AIは相手が何を言いたいのか推測できるようになったのです。機械学習はデータの蓄積と分析を繰り返すことで、多彩な文章表現を理解することが可能になりました。これによって現在は、顧客サポートのロボットチャットの応答が正確になるなど、多彩な場面で進歩が見られます。対応が柔軟になった結果、活躍の幅も広がり、多彩な分野で研究が行われるようになりました。現在のAIブームの火付け役となったのが、機械学習だと言えるかもしれません。

この機械学習を更に発展させたのが、ディープラーニングです。機械学習は例えば、データを分析する時に顧客の「年齢」や「世代」など、判断に使う要素を人間が指定します。Excelの表のようなデータを得意とします。しかし、ディープラーニングはExcelの表のように扱えない、画像や音声、文章などを渡すと、どこに着目すべきかも自動で判断します。そして、独自に着目した要素を元に学習を進めるのです。現在は医師の目では認識困難だった疾患を、患部の画像をAIが解析して発見するなど、多彩な場面で研究が行われています。

ただ、ディープラーニングは高度な分析が可能ですが、その反面として取り扱いが容易ではありません。あいまいなことを認識できる一方、認識できるようになるには非常に多くの教師データが必要になります。大量のデータをまだ持っていない一般的な企業や、Excelのデータのようなものを扱う事が多い企業では、ディープラーニングが必要ない/適切でない場面もしばしばあるでしょう。このため、実際には機械学習が活用される機会も多いです。機械学習も専門知識は欠かせないものの、近年は扱いやすいソフトやライブラリも多数登場しており、ハードルが下がってきました。しかも、学習力は高まっており、応用の幅も広がっています。

まとめると、機械学習とディープラーニングにはそれぞれに長所・短所があるため、ニーズやコスト、導入の容易さなどで使い分けられているのが現在の状況です。

機械学習の仕組み

AIに膨大なデータを与えて、アルゴリズムと呼ばれる処理手順に則って分析・学習させるのが機械学習の仕組みです。ただし、AIは初期段階では、何も理解していません。このため、例えば画像認識のAIだと、「AIがキクと予測した画像は正解はひまわり」と教えていきます。AIはこれにより、間違いを正して何が正解なのかを判断していくわけです。もちろん、機械学習と言う位ですから、人間が手作業で正解を教える必要はありません。AIは自動でシミュレートを繰り返し、間違えないように判断できる数値パラメータを学習します。

機械学習で大切なのは、データの種類や分析の目的によって、アルゴリズムを使い分けることです。分析の目的は文章の処理や画像の識別など多彩ですから、それぞれの処理に適した多彩なアルゴリズムが開発されてきました。具体的には、Excelのような構造化データがが得意なサポートベクターマシンや勾配ブースティング決定木、統計的データ分析に利用されるクラスタリング、自然言語や画像のパターン認識が得意なディープラーニングなどがあります

今後の進化にも要注目

機械学習について紹介してきました。現代社会においては多彩な場面で活用が進んでいる、有益な情報処理技術の一つです。
先進的な技術と言えるものの、現在はソフトやアプリが増えたことで取り扱いが容易になっており、チャットボットや画像識別プログラムなどの形で目にする機会が増えてきました。
今後は技術の進化によって更に重要度が増す可能性が高く、目が離せません。

最新情報をチェックしよう!
企業向けAI人材育成サービス

企業向けAI人材育成サービス

AI事業発足やAI導入に必要な人材育成のステップとAI研究所が提供するサービス。AI研究所の人材育成サービスでは、3つのステップを軸に御社の業務内でAIを活用できる人材育成やAIプロジェクトの支援を行います。

CTR IMG