AI研究所 - AI(人工知能)に脅かされないために、AI(人工知能)を作る側の人間になる -

HOME  >  ディープラーニングとは?初心者でも分かるディープラーニングの仕組みまとめ

公開日:2020.10.20 

ディープラーニングとは?初心者でも分かるディープラーニングの仕組みまとめ

機械学習

「ディープラーニングって何?」
「ディープラーニングの仕組みを教えて欲しい」
こういった方に向けて書いています。

✓本記事の内容
・ディープラーニングとは?
・ディープラーニングの活用事例
・ディープラーニングの仕組み
・ディープラーニングの学習方法

この記事は、具体例を入れつつ、ディープラーニングについて解説していきます。初心者でも分かりやすい内容となっているのでぜひご覧ください。

ディープラーニングとは?

ディープラーニングとは、あるタスクをこなせるように機械に学習させる機械学習の1つです。別名を深層学習といいます。

ディープラーニングは、人工知能の発展には欠かせません。
*人工知能とは、機械に知能を持たせる、機械が物事やルールを理解するための仕組みなどの幅広い意味を持ちます。

また、自動運転などの画像認識、電話やスピーカーなどの音声認識をはじめとして、いろいろな分野で活用されています。

少し前に有名になったものとして、2017年にDeepMind社が作った囲碁AIの「AlphaGo」が、中国最強と言われるの囲碁棋士に3番勝負で3連勝したというニュースがありました。他にも、グーグルのAIが動画を見て、動物の概念を学習したというのも記憶にあるのではないでしょうか。

このようなニュースから、最近ではディープラーニングが注目されています。

人工知能について詳しく知りたい方はこちらからどうぞ↓

[5分で分かる] AI(人工知能)とは? AIの作り方と機械学習(ディープラーニング)

ディープラーニングの活用例

では、ディープラーニングの活用例についてみていきましょう。
ディープラーニングの活用事例には4種類あり、それぞれ画像認識、音声認識、数値データ、テキストデータとなっています。

画像認識

ディープラーニングの学習に使用される画像データが入手しやすいとして、かなり発展が進んでいる分野です。主に、自動運転、工場での不良品検知、顔認識技術などで活用されています。

中でも、自動運転は発展が進んでおり、大手の自動車企業やIT企業が自動運転の研究に力を注いでいます。
自動運転技術に特化しているPreferred Networksがトヨタから約105億円の出資を受けるといった事例もそのうちの1つです。

画像認識の分野において、自動運転の他に、農業にも用いられようとしています。
農業とAIを掛け合わせるなんてイメージが湧かないという方も多いのではないでしょうか。

しかし、農業とAIの相性は非常に良いのです。

農業には多くの人手が必要。AIはタスクの自動化にたけている。
このように農業のデメリットをAIが補ってくれます。

日本の農業は、農業従事者の高齢化などの理由から人手不足が問題視されています。しかし、こうした問題も、AIによって解決することができるのです。

音声認識

ユーザーによる利用とデータの処理がリアルタイムで進むことが多いです。

iPhoneのSiriなどの発言内容を文字に変換するシステム、発話者の感情を分析する音声感情解析技術、音声検索・音声操作・多言語の同時翻訳システムなどに活用されています。

中でも、音声感情解析技術は、医療の現場でも使用されており、声の大きさや話し方から働く人のストレスを算出するというサービスが存在します。

数値データ

生産工程のデータを集めることで、品質管理、生産計画の作成、在庫管理などを改善し、生産効率アップに使われています。また、YouTubeやGoogle Playなどのレコメンド機能にも使われています。

また、数値データは病気の発症率や株価などの様々な数値を予測できるという特徴を持ちます。*ビッグデータの取得が簡単になったため。

テキストデータ

TwitterやFacebookなどのSNSの普及によってテキストデータが増加し、活動範囲は大きくなっています。
主な活用先は、自動会話プログラムや自動翻訳、SNSマーケティングです。自動翻訳においては、音声認識を組み合わせたリアルタイムでの音声翻訳の実用化が進んでいます。

また、音声認識と同様に、医療分野でも活用されています。
具体的には、まずSNS上のトーク履歴をテキストデータとして取得し、人工知能で分析します。そして、文脈からどのような症状が現れるのかを学習させるのです。

ディープラーニングの仕組み

ディープラーニングは、人間の神経細胞の仕組みを参考にしたシステムです。ディープニューラルネットワークとも呼ばれています。

このディープニューラルネットワークを利用することで、特徴を段階的に深く学習でき、時には人間の認識精度を超えることがあります。

ディープラーニングは、大規模なデータとニューラルネットワークの構造を利用して学習をおこないます。それらのデータを入力する場所を入力層、入力したデータを統合、計算し、学習する場所を中間層、統合、計算したデータを出力する場所を出力層といいます。

その中でも、中間層を増やすことで深く学習することが可能です。中間層が2つ以上あればディープラーニング(深層学習)となります。*2~150以上の層になることもあります。

こちらの動画はオススメです↓

機械学習とディープラーニングの違い

通常の機械学習では、画像から手動で特徴量を抽出することからはじめ、抽出した特徴量をつかって画像内の物体を分類するモデルを作成します。

その一方で、ディープラーニングは、特徴量の抽出からモデル作成までをすべてが自動で行なわれます。また、機械学習と異なり、データが増えて行くにつれ、精度がどんどん向上していくという利点もあります。

もっと詳しい違いを知りたい方はこちらからどうぞ↓

ディープラーニングとは?機械学習との違いややり方まで徹底解説

機械学習とディープラーニングのどちらを選択するか

機械学習とディープラーニングのどちらかを選択するときは、以下の2つのものがあるかを確認しましょう。

・高性能なGPU
・大量のラベル付されたデータ(数千の画像)

これらのどちらかがない場合は、機械学習を選択するべきです。

ディープラーニングは機械学習よりも複雑になっています。そのため、正しい結果を得るには少なくとも数千の画像を用意しなければなりません。そして、数千もの画像を学習する時間を短縮させるために高性能のGPUが必要になります。

ディープラーニングの学習方法

CNN(畳み込みニューラルネットワーク)

CNNとは、画像認識の分野で使われるニューラルネットワークのことです。物体検出、領域推定、転移学習でも使用されています。

CNNは、畳み込み層とプーリング層が交互に多数組み込むことで構成されます。

畳み込み層では、入力された画像を分割し、その分割した部分で計算します。そして、特徴を特定し、抽出するのです。プーリング層では、畳み込み層で抽出された特徴を圧縮し、不要な部分をカットします。

この2つの処理が繰り返されて画像認識をおこなうということです。

RNN(リカレントニューラルネットワーク)

RNNとは、自然言語処理の分野で使われるニューラルネットワークのことです。

自然言語処理でRNNを活用するためには、いろいろな文章の種類や、会話の流れを学習させる必要があります。

この学習により、違和感なく言語処理や時系列データの入力ができるようになり、関連性をつけることができるのです。

LSTM(Long Short Term Memory)

RNNを拡張した機能を持ちます。

RNNの持つデメリットとして、データの関連性が長期的なのか、短期的なものなのかを区別できないというものがあり、それを補うのがLSTMです。

LSTMでは、重要なデータを残し、不要なデータを消すことができます。

GAN(Generative Adversarial Networks)

GANとは、「敵対的生成ネットワーク」というニューラルネットワークのことです。
大量のデータから特徴を学習し、まだ実在しない画像をつくることができます。

画像だけでなく、アニメのキャラクターを学習させれば、新しいキャラクターを作ることができるなど、高い表現力が特徴的です。

まとめ

今回は、ディープラーニングの基本的な部分について解説しました。これからの時代において、ディープラーニングは欠かせません。

人工知能の発展を悲観的に捉えるのではなく、生活が豊かになると捉え、勉強していくことが大事なのではないでしょうか。

最後までご覧いただきありがとうございました。


参考になったら「いいね!」と「シェア」をお願いします!!

このエントリーをはてなブックマークに追加
AI(人工知能)セミナー開催中