YOLOとは?物体検出の手法を大きく進化させたYOLOを徹底解説

こんにちは、AI研究所の三谷です。
自動車の運転が無人になるのは、かなり近い未来かもしれません。
海外では、実際に無人のバスや宅配車などが走っている国は既に存在します。
無人での自動運転に欠かせない技術として挙げられるのは、コンピューターの物体検出能力でしょう。
コンピューターの技術が進化するにつれ、機械が正確に物体を認識できるように、さまざまな技術が開発されてきました。
その中でも特に認識能力の向上に大きく貢献したのがYOLOです。

ですがこのYOLOは「どのような働きをして、どのような仕組みを持っているのか」と言うことを知らない方は多くいるでしょう。
この記事では、物体検出手法のことについて知りたい方のために、YOLOの詳細や実例・YOLOを学習する方法を解説していきます!

そもそもYOLOとは何か!?

YOLOで物体検出したときのイメージ

YOLOとは、コンピューターが外部の物体を検出するときに使用される代表的なアルゴリズムのことです。
YOLOという名前の由来は、「You Only Look Once」という英文の頭文字をつなげて作られた造語で、日本語に翻訳すると「一度見るだけで良い」という意味を持っているアルゴリズムです。

YOLOが開発される以前にもさまざまな物体検出手法が存在しましたが、それ以前の方法とは一線を画す優れた物体検出能力を持っていたことが、このアルゴリズムが広く注目されるようになった理由です。
YOLOがより正確に物体を検出できるのは、検出のためのアプローチが従来の手法とは全く異なっているからです。
ここからは、YOLOのアルゴリズムに至るまでの物体検出技術の歴史を振り返り、どのような問題があり、どのようにその問題を乗り越えていったのか解説していきます。

YOLO以前の物体検出手法のアルゴリズムのデメリット

YOLOのアルゴリズムを説明するうえで、物体検出能力のアルゴリズムはどのような経緯で発展していったか説明しておくとわかりやすいでしょう。
まずは、物体検出手法のアルゴリズムの歴史を見ていきましょう。
従来の物体検出手法の場合、物体を検出する場合は複数の要素に分類してからどのような物体かを判断するという方法が採用されていました。

最初に検出すべき物質の範囲を定めることから始め、どこまでが検出すべき物体がどこからが背景に該当するかを個別に判断する必要があります。
検出すべき物体の範囲が定まったら、その範囲に含まれる画像の特徴を分析することにより、どのような物体が写っている映像なのかさらに詳細に推測する作業が進められます。
最後に抽出された特徴を基にして対象となる画像を分類することにより、物体を検出することができるという流れです。
その一方で、こうした方法による物体の検出は複数のプロセスに分けて検出を行う分、時間がかかるというデメリットがありました。

YOLOによって短い時間で物体の内容を検出できるようになった

このような欠点を克服するために開発されたのがYOLOで、より短い時間で画像内に写されている物体の内容を検出できるのが特徴です。
YOLOを使用すれば、解析したい画像をコンピューターにインポートするだけで、画像の中に含まれている物体の領域を出力できます。
このようなことが可能なのは、ニューラルネットワークを使用して画像を解析しているからです。

物体を検出したい画像が入力された場合、まず、YOLOでは画像をリサイズする作業が行われます。
正方形にリサイズするのがYOLOの特徴ですが、縦長や横長の画像も正方形に一度リサイズすることで、ニューラルネットワークを使用した分析がしやすくなるメリットがあります。
正方形にリサイズした画像をさらに細かく正方形で分割することも、YOLOのアルゴリズムの特徴です。

正方形内に分割されたそれぞれの小さな正方形はグリッド・セルと呼ばれ、グリッド・セルの特徴を基にして物体の検出が進められていきます。
グリッド・セルの内容から物体の種類が推定され、それぞれの推定がどれくらいの可能性で的中しているかを考慮しながら、さらに細かく画像の解析が行われていきます。

YOLOで物体の範囲を特定できる

YOLOで画像に写っている物体の範囲を特定するために使用されているのがバウンディング・ボックスです。
バウンディング・ボックスとは、画像の中に写されている各物体のおおよその範囲を決めるために使用されるボックス型の図形です。
それぞれのバウンディング・ボックスには画像内の位置を表す座標軸が設定され、さらにそのボックス内に含まれているものが物体である可能性についても数値として計算されます。
この数値はコンフィデンス・スコアと呼ばれていますが、個々のボックス内の画像が物体か背景なのかを判断することにより、物体全体の大きさも推定できます。

YOLOによる推測の技術は正確性が高い

YOLOによる顔認証
YOLOではグリッド・セルとバウンディング・ボックスの分析により得られたデータの結果を統合することにより、どのような物体が画像内に写っているかを特定できます。
グリッド・セルの分析は個々のセルのクラス・プロバビリティを推測していくことにより行われますが、クラス・プロバビリティとはセル内に写っている物体が特定のクラスに属している可能性のことです。
この数値が高いほど、コンピューターの行ったクラス分けの正確性が高くなります。
このクラス・プロバビリティと前述のバウンディング・ボックスを統合することにより、画像内のどの範囲にどのような物体が写されているのかを大まかに推測することができます。

物体検出に関するアルゴリズムの説明はこちらの動画でも詳しく解説されています。

YOLOのアルゴリズムに入門するなら、セミナーを活用しよう!

YOLOのアルゴリズムは、あらゆる場面で役に立ちます。
しかし、問題なのはそのアルゴリズムを理解し実装することが難しい点にあります。
YOLOのアルゴリズムを本格的に学びたい人は、セミナーの利用がおすすめです。
YOLOに関する知識が全くない人が勉強を始める場合には、ディープラーニングの基礎事項から学ぶ必要があります。
深層学習の基本的なことから丁寧に教えてくれるようなセミナーも開催されているため、初心者でもしっかりと理解しやすくなっています。
わからないことがあったら講師に質問ができるところもセミナーの利用しやすいポイントです。
セミナーなら独学ではつまずきやすい部分も、質問をすることでしっかりと理解しながら勉強を進められるのがメリットです。

おすすめのAIエンジニア講習をご紹介!

YOLOのアルゴリズムを本格的に学びたい方、ディープラーニングの基礎事項から学びたい方におすすめなのが、「AIエンジニア講習」です!
AIエンジニア向け育成講座は、AIプログラミングを3ヶ月で習得できる、AIエンジニアの育成セミナーです。
いつでもどこでも学習できるパソコン、スマホ、タブレット対応のEラーニング学習の為、自分の都合の良いペースで取り組めます。学習期間の目安は3ヶ月、全12回の講座を動画で視聴しながら自分のペースでしっかり学習できます
内容は、実務で使えるAIの実装技術と活用術を習得できるおすすめのセミナーです!
もちろん非エンジニアの方でも、ゼロからプログラムの実装方法を学ぶことができます。

YOLOが使用されている実例

YOLOは、さまざまな業界において活用されている物体検出手法です。
サービス業を行っている一部上場の株式会社などでも利用されている技術で、店舗を運営している事業者などが効率的な店舗運営のために利用を進めています。
ここからは、YOLOが使用されている実例を研究していき、実用の可能性を探っていきましょう。

顧客分析に使用されたYOLOの技術

飲食店や販売店などの店舗に来店する顧客を分析する目的でもYOLOの技術は使用されています。
店舗の内部全体を撮影できる位置にカメラを設置して、記録された画像をYOLOを使って分析すればリアルタイムで店内にいる利用客の数を把握できます。
顧客の情報を収集することは、飲食店や販売店を運営していく上で重要になります。
分析された利用客の数を各時間帯ごとにデータとして記録しておくことも可能です。
現在では個人の顔認証もスマホなどで実装されています。

顔認証に関して詳しく知りたい方は、「高速&高精度な「Laboro.AI顔検出エンジン」とは!?の記事を参考にしてください。

YOLOはマーケティングのための分析に利用できる

どのような時間帯にどれくらいの数の利用客が訪れているかを情報収集し、細かく把握しておけば、より効率的な店舗運営をするためのヒントが見つけられることもあります。
YOLOの技術がさらに発達すれば、画像を分析するだけでさらに正確に利用客の詳細な情報を確認できるようになる可能性もあります。
男女の区別や日本人と外国人の区別などもできるようになれば、より詳細に個人単位で顧客分析が可能になります。
店内の映像をYOLOで分析することにより、店内に設置されている座席がどれくらいの割合で顧客に利用されているか計算することもできるでしょう。

分析の結果により、座席の数を増やすなどの対応もできるため、顧客に対してより細やかなサービスを提供できるようになります。
ドライブインのような施設では、YOLOによって車両の混雑状況も事前に把握しておいて顧客に情報を送ることで時間帯を分散できます。
顧客はよりサービスのより店舗を好むため、顧客単位の売り上げも上がり、経営者にとっても利用するメリットの多い技術です。
機械学習による売り上げ予測の仕組みを徹底解説」の記事では、情報を収集してデータ化し、マーケティングにつなげる方法を解説しています。

AIの人材研修はこちら

YOLOによって安全対策も可能になる

YOLOによるセキュリティー店舗の外を歩いている通行人や走行している車両の数なども、店舗の外にカメラを設置してYOLOを使用することにより分析が可能です。
どのような時間帯に人や車の量が多くなるかを把握することで、営業時間などを決定する際にも利用できます。
YOLOはセキュリティーのためにも活用することが可能です。
立ち入り禁止の場所に人が侵入しないようにするために、監視カメラを設置する場合にもYOLOによる分析を合わせて利用することで、さらに効果的な安全対策ができます。
監視カメラに写された人間と思われる物体をYOLOを使って検出することで、異変に対する素早い対応が可能になります。
自社のオフィス内に不審な人が侵入してもすぐに警備会社に連絡できます。

YOLOは事業の活性化だけではなく、安全性の確保にも利用できるのです。
多くの一部上場している株式会社では、導入コストがかかるもののそれ以上に多くのメリットを享受できるYOLOを実装させています。
AI(人工知能)の活用事例10選!業種別にAIの活用事例を分かりやすく解説」の記事では、今回紹介した事例以外にもAIを利用した事例を紹介しています。

ディープラーニングに欠かせないYOLOのアルゴリズム

コンピューターの深層学習にも広く利用されているYOLOのアルゴリズムについてご紹介してきました。
従来の物体検出アルゴリズムよりも短時間で正確に物体を検出できるのが、YOLOのメリットです。
このYOLOのアルゴリズムは、人間のあらゆる生活の不便な部分を改善してくれる可能性を持っています。
つまり、ビジネスにおいても今後は有益な技術としてなくてはならないものになるでしょう。

YOLOはさまざまな分野で利用されることが期待されていますが、一般企業の店舗運営にも利用することができます。
ビジネスや生活に役立てるにしても、YOLOの知識や技術の習得が必要になります。
ITに詳しい人材を求人するにしても、事業の代表者がある程度の知識を持っていなければ良い人材を見分けることはできません。
YOLOを知識や実装するための技術を習得するためには、独学では難しい部分もあります。
YOLOに関心を持たれた方は、記事でご紹介した、YOLOの学習に繋がる知識を学べるAIセミナーや、講演会を探してみてはいかがでしょうか。

AIエンジニア講習はこちら!

最新情報をチェックしよう!