「ディープラーニングによる画像認識の仕組みを教えて欲しい」
「画像認識はどのように活用されているの?問題点はあるの?」
「実際に画像認識を使いたいときはどうすればいいの?」
こういった疑問に、この記事では具体例を出しつつ、分かりやすいように解説していきます。
読み終わった後には、ディープラーニングによる画像認識についての知識が深まっているはずです。
ぜひご覧ください。
ディープラーニングによる画像認識とは?
画像認識とは、画像に写っているものの特徴を分析し、何が写っているのかを識別するパターン認識技術の1つです。
*パターン認識技術とは、画像や映像、音声などの様々な情報の中から、特定の規則や意味などの特徴をもつものを識別することです。
人間と違い、コンピュータは、画像に写っているものが何かを理解することができません。
そのため、たくさんの画像データから対象物の特徴を学習させる必要があります。
その学習によって、コンピュータは新しい画像に写っているものを確率として識別することができるようになるのです。
この学習方法として、ディープラーニングが注目されています。
注目されるようになった理由として、2012年に開催された「ILSVRC2012」という画像認識の大会があげられます。
画像認識の精度を競い合う大会なのですが、2011年までの正答率は高くても70%台前半でした。
しかし、2012年にHinton先生のチームがディープラーニングを使ったモデルで85%の正答率をたたき出したのです。
2位と10%以上の差をつけての圧勝でした。ここからディープラーニングに大きな注目が集まります。
そして、2015年には「ILSVRC2015」の結果で人間の認識性能を越えたのです。
現在では、画像認識とディープラーニングは切っても切り離せない関係にあります。
ディープラーニングに入門する方法は以下の記事をご覧ください。
ディープラーニングによる画像認識の仕組み
基本的に画像認識は以下の以下の仕組みで行なわれます。
- 画像処理
- 画像から特徴を抽出
- 対象物の識別
①画像処理
画像のノイズやゆがみを除き、明るさや色を調整、物体の領域を切り出すことでコンピュータが画像を認識しやすくします。
②画像から特徴を抽出
画像からピクセル単位で特徴を抽出し、パターンを把握することで画像に写っているものが何かを認識します。
*ピクセルとは、画像を構成する最小要素のことです。
③対象物の識別
事前に「ラベル」「大量のデータ」を学習させます。
そして、新たに識別させたい画像を入力し、画像に何が写っているのかを識別します。
ここからは、ディープラーニングによる画像認識の仕組みである、CNN(畳み込みニューラルネットワーク)について解説していきます。
CNN(畳み込みニューラルネットワーク)
先ほど紹介した、「ILSVRC2012」で優勝したチームが使用していたのが、CNNです。
CNNの特徴は、ニューラルネットワークの層を「畳み込み」と「プーリング」に分けて、それぞれで異なる作業を実行することにあります。
- 畳み込み…画像中から切り出された領域に関数を重ねることで特徴をあらわす図をつくる作業。
- プーリング…特徴を選んで、ひとまとめに絞り込み、一番値の大きいものを選ぶ作業。
CNNは「畳み込み」と「プーリング」を交互に行なうことで構成されており、画像認識以外にもいろいろな分野で活用されています。
より詳しく知りたい方はどうぞ↓
画像認識が活用されている例
画像認識が活用されている例として、
- 顔認証
- 画像診断
- 外観検査
の3つをあげていきます。
①顔認証(防犯・ゲート)
顔認証とは、顔の部位の配置場所や大きさを元に人工知能が判別する認証方法です。
スマホやドアのロック解除をはじめ、空港での出入国審査などに活用されています。
また、防犯カメラにも活用されています。
具体的な例として、ALSOKはNTTドコモと連携し、防犯カメラの映像から不審な人物や異常を捉えると、自動的に警備員を呼び出すシステムを開発しています。
このように顔認証は、私たちの生活と密接に関係しています。
②画像診断(医療・介護)
画像診断は、医療や介護の現場で活用が進んでいます。
ガンや骨折、脳血管の損傷などをはじめ、人間では発見することができなかった病気やケガも発見することが可能です。
具体的な例として、理化学研究所では、画像認識を活用することで早期ガンの高精度な検出に成功しています。
また、介護の分野でも、高齢者の動きをモニタリングすることで転倒などの危険を検知し、事故を防止するシステムも開発されています。
このように医療や介護の現場でも画像認識は、活用されているのです。
③外観検査(製造業)
外観検査とは、工場などで製品や部品の異常を確認する検査のことです。
例えば、部品に付いたサビ、衣類の破れなどになります。
人間が不良品の確認をするよりも画像認識による確認の方が、早くて正確です。
そのため、最近では、画像認識技術を導入する工場が増えてきています。
画像認識の問題点
画像認識には、良い面の他に以下のような問題点もあります。
- システムの精度差
- プライバシー侵害
それぞれ深掘りして解説していきます。
①システムの精度差
画像認識の精度には、画像データの量が大きく関わってきます。
なぜなら、画像データが多いとそれだけ深く学習できるということを意味するからです。
下記のような2社を想定すると分かりやすいです。
- A社:画像データの保有量が多い
- B社:画像データの保有量が少ない
この2社を比較すると、B社よりも画像データの保有量が多いA社の方がシステムの精度が高いと言えます。
システムの精度が低いことで発生する問題は、認識に時間がかかったり、結果を誤って表示してしまうことです。
システムを導入する分野によっては大きなトラブルにもなりかねません。
そのため、画像認識システムを導入する時は、いろいろな会社と比較して慎重に選ぶことをオススメします。
②プライバシー侵害
画像認識システムは、映像や写真から容易に個人の特定ができます。
これは、容易にプライバシーを侵害してしまうという意味でもあります。
そのため、取得した顔データに目的以外の使用制限をかけたり、破棄するなどプライバシーを侵害しないようにすることが重要です。
問題にならないためにもデータは厳重に扱いましょう。
画像認識ライブラリを紹介
画像認識システムを導入するには、ライブラリというものを使う必要があります。
ここでは、主要なライブラリを3つ紹介します。
- TensorFlow
- OpenCV
- PyTorch
①TensorFlow
機械学習モデルの開発、トレーニングに役立つオープンソースのコアライブラリです。
ブラウザで直接実行できるColabノートブックをつかって、すぐに作業を開始できます。
②OpenCV
OpenCVは、インテルが開発したオープンソースのコンピュータビジョン向けライブラリです。
画像処理や画像解析、機械学習などができます。
③PyTorch
PyTorchは、Facebookの人工知能研究グループにより開発された、Pythonのオープンソースの機械学習ライブラリです。
まとめ
今回は、ディープラーニングによる画像認識について網羅的に解説してきました。
画像認識は、身近なところから、医療や製造分野など様々な場所で活用されています。
プライバシーの侵害には気をつける必要があります。ただし、そこさえ気をつければ良い面が多いです。
興味を持った方は、画像認識の導入を考えても良いのでは無いでしょうか?
最後までご覧いただきありがとうございました。