重要なお知らせ:新型コロナウイルス、インフルエンザ等の感染予防・拡散防止の対策についてこちらをご確認ください。

AI研究所 - AI(人工知能)に脅かされないために、AI(人工知能)を作る側の人間になる(AI人材育成・セミナー) -

  • お問い合わせ

HOME  >  GAN(敵対的生成ネットワーク)とは?仕組みや特徴、活用事例まで徹底解説

公開日:2021.04.09 

GAN(敵対的生成ネットワーク)とは?仕組みや特徴、活用事例まで徹底解説

AI(人工知能)の知識

昔の白黒写真がカラーで再生されたり、もう実在しない人の顔が再現されることがあります。
それは、最近進化するディープラーニングの技術の中でも注目されているGAN(敵対的生成ネットワーク)によるものです。
GAN(がん)によって今までできなかったことが可能になっていますが、いったいどんな技術なのでしょうか。
ここでは、GAN(がん)について説明していきます。

ちなみに、ディープラーニングについて知らない方は、下記の記事から読むことをおすすめします。

ディープラーニングとは?初心者でもわかるディープラーニングの仕組みまとめ

GAN(がん)とは

GAN(がん)は2つのネットワークを競わせて、入力したデータや情報の学習を深めるので「敵対的生成ネットワーク」ともいわれています。
コンピュータに大量のデータや情報を読み込ませ、アルゴリズムによって分析させるのです。
事例となる特徴を学習させることでパターンを見つけ出させます。
機械学習には2つのモデルがあり、その1つは入力したデータ画像が何かをコンピュータに判断させるモデルです。
もう1つが生成モデルといわれる、入力したデータから新しく擬似データを作るモデルです。
GAN(がん)はその生成モデルの1つで入力されたデータや情報の特徴を学習していくことで、新たに実在しないデータや情報を作ったり、その特徴に近づけて作り出します。

GAN(がん)の主な使いみち

GAN(がん)の使いみちとしては画像生成が有名です。
データや情報を生成するということで、ディープラーニングを補うことができます。
今までは、データや情報を増やすために、サンプル画像を用意して色を変えたり傾けたりしてきました。しかしながらGAN(がん)の技術によって、新たに特徴を持ったデータが作り出せるので、データ不足に陥りがちなディープラーニングにも応用することができます。
「独自の特徴を持ったデータを増やす」ということから、音声を生成したり、新しい画像を作ったり、低解像度の画像を変換して高解像度にしたりすることに期待が持てるようになりました。
少し内容は難しいと思いますが、GANは画像と相性が良いと覚えておきましょうう。

GAN(がん)の仕組みとは

GAN(がん)は「敵対的」生成ネットワークとあるように、競い合う仕組みになっています。
Generator(ジェネレーター)とDiscriminator(ディスクリミネイター)という2つのネットワークがあり、最終的には本物とほとんど変わらないデータ・情報を作成するために、いたちごっこのように競り合うのです。
ジェネレーターは、本物そっくりに描こうとする贋作師、ディスクリミネイターはそれを判別する鑑定士に例えてみます。
贋作師のジェネレーターは、元にした絵画(入力データ)から特徴を捉えて似せた「贋作」を作成し、鑑定士であるディスクリミネイターは、ジェネレーターの偽物を「本物の絵画」と比較することで判別します。
このように、生成するネットワークと識別するネットワークの相互作用によって、少しずつデータは本物に近いものになっていきます。

初期の段階では、一目見ただけで偽物とわかるような質の低い絵画を作っているので、すぐに違いを見破られてしまいます。
すると贋作師は、前よりも似せたものを作り出して鑑定士をだまそうとします。
徐々に繰り返すうちに、本物にそっくりなものを作成してくるので、鑑定士も判断するのが難しくなってくるのです。
最後には鑑定士が本物だと判断する偽物を作り出すことが目標となっているのです。
ジェネレーターとディスクリミネイターが競い合うことで、最終的には本物と見間違えるほどのレベルまで生成データを持っていきます。
これからGANで生成された画像は画質だけでなく、本物と相違のないレベルの高い画像が生成されるでしょう。

GAN(がん)の活用事例

GAN(がん)を利用して様々な研究が進み、情報やその用途も増えてきています。
何ができるのか紹介していきます。

高品質の画像を作る

高画質の画像生成
まずは、高品質の画像を作り出せることです。
データサンプルを与えて低品質の画像から高い解像度のデータに仕上げていきます。
また、いくつかの顔の画像を取り入れて、実際には存在しない人の顔画像を作り出すことも行われています。
ファッションやアニメなどの分野では実用に向けた取り組みがされています。

文章から画像を起こす

画像をテキストなどの情報から生成することも可能です。
最初は荒い画像でしたがだんだんと質の高い画像を生成できるようになってきました。
これにより、音声で写真の修正ができたり、脚本からアニメ映画を作ることも期待できます。

画像を翻訳する

1つの画像から違う雰囲気の画像に翻訳することも行われています。
例えば、ラフで描いたスケッチを漫画家が描いたような作品に仕上げたり、風景写真を印象派の作品のようなイメージに仕上げることもできそうです。
これから技術を使って画像を生成するのであれば、GAN(がん)は利用する価値があると言えるでしょう。

動画を翻訳する

動画から動画へと翻訳する技術も高くなっています。
2人の全く違う別人をシンクロするように同じ動きにする動画も作られています。
生存していない女優や歌手がテレビに登場する日も遠くないかもしれません。

画像の特定領域を変換する

画像の中にある特定のスペースを別のものに自然に変換する手法もあります。
ツールを使うことで、画像内のある部分のみを変換することができます。
例えば、ファッションモデルの画像では履いているパンツからスカートに変えるのも可能になります。

スタイルを変換する

スタイルの変換

2つの異なる画像を交換することもできるのです。
例えばウマとシマウマの画像では、ウマがシマウマに変わったり、その反対にシマウマがウマになったりできるのです。

GAN(がん)の応用研究とは

GAN(がん)の強みを活かした応用研究が開発されています。
その研究を紹介します。

DCGANとは

オリジナルのGAN(がん)では、データを作るのがメインですが、DCGANは、画像の生成が優れています
深いネットワークになっても安定した学習ができるようになり、GANに比べてさらにはっきりと鮮明な画像を生成することが可能になりました。

CycleGANとは

CycleGANは、無関係な2枚の写真を用いて、その特徴を似せ合うようにネットワークを構築します。
例えば風景写真とデータを組み合わせて、若葉を紅葉にしたり、夏っぽいイメージから冬っぽいイメージに変えるなど季節を入れ替えることもできます。

StyleGANとは

StyleGANは、リアルな写真生成を可能にし、注目が集まりました。
StyleGANはそれまでのジェネレーターの構造を大きく変えたのです。
入力するのに不要な情報を一度別のところでマッピングして、そこで得た情報をジェネレーターに入力しました。
これにより画像の不要な情報は柔軟に調整することができるようになり、様々な画像が思い通りに作成できるようになったのです。
そしてとてもリアルな高品質な画像も作成可能になっています。

GAN(がん)のメリットやデメリットとは

GANのメリット

それではGAN(がん)にはどんな特徴があるのか見ていきます。

GAN(がん)のメリット

それでは、GANのメリットを4つに厳選して解説していきます。
これから紹介するメリットを把握して、GANの利便性や機能を理解しましょう。

新しいデータや情報を作れる

GAN(がん)は、従来の角度や色を変えたりすることではない、サンプルの特徴を持った新しいデータや情報が作れます。既存の画像の複製ではなく、全く異なる新しいデータを生成できるのは大きなメリットと言えるでしょう。

画像を高画質にできる

既存の方法に比べて、GAN(がん)を利用することで画像を高画質にすることが可能です。
現在は画質に拘る人が非常に多い為、GAN(がん)の技術は世界中の人にとって非常に大きな価値と言えるでしょう。
これからもmGANの技術によって画像がさらに高画質になると予測されています。

他の技術との合わせ技が可能

GANはword2vecの技術と組み合わせることで、画像ラベルから演算が行えるようになりました。
例えば、「サッカーをしている子供ー子供+プロサッカー選手=サッカーをしているプロサッカー選手」という演算から、サッカーをしているプロサッカー選手の画像を生成することが可能です。
現在は簡単な演算で画像が生成できるようになっていますが、将来的には複雑な演算でも適切な画像を作成できるようになると言われています。
また他にも様々な技術と合わせ技ができるようになれば、GAN(がん)の利用用途はさらに増えるでしょう。

医療で利用できる可能性がある

GAN(がん)の技術は画像だけでなく、医療の現場でも採用される可能性があります。医療現場の検査などでGANを利用されることになれば、より多くのデータや情報収集に役立つと言われているようです。
現在の多くの医療の現場は、患者を検査した際に撮った写真でのみデータを収集しています。GAN(がん)の技術を使うことで多くの写真をデータ・情報を収集できるので、新しい療法の発見にも使われるでしょう。

GAN(がん)のデメリット

先ほどはGAN(がん)を利用するメリットを紹介しましたが、デメリットもあるので確認しておきましょう。

判断基準が不透明

コンピュータが作成した画像データを、どのような基準で「似ている」とするのか判断が非常に難しいです。
「似ている」という判断基準が不透明なことによって、人の価値観によっては全く似ていない画像が完成する可能性も十分に考えられます。
しかしながら、これから技術が進歩していけば、判断基準の精度が少しずつ良くなると予測されている為、大きなデメリットとは言えないでしょう。

動作の不具合が多い

GAN(がん)は素晴らしい技術ですが、動作の不具合が多く、安全に利用できるかと考えれば少し不安が残ります。

  • 勾配消失問題:初めは簡単に判別ができるため学習が十分に行われない
  • モード崩壊:だませるようになったら今度はその特徴を持つ画像しか生成しなくなる

上記2つは、GAN(がん)を利用する際に最も注意しなければいけないエラーです。これからGAN(がん)の利用を考えている人は、「勾配消失問題」や「モード崩壊」などのエラーが起きた時に、どのように対処するのか検討しておきましょう。

GAN(がん)は画像生成に欠かせない

GANは画像生成に欠かせない存在

GAN(がん)は、Generator(ジェネレーター)とDiscriminator(ディスクリミネイター)という2つのネットワークを競わせることで、入力したデータの学習を深めていくので「敵対的生成ネットワーク」ともいわれています。
活用例では、高品質の画像を作ったり、2つの画像のスタイルを変換することもできます。
応用研究としては、若葉を紅葉にできる「CycleGAN」や「StyleGAN」などがあります。これからも研究は継続されるので、今後の技術進歩に注目です。

GANについて:まとめ

本記事では、GAN(がん)の仕組みや特徴、活用事例などを徹底解説しました。
近年はIT技術の進歩が非常に早く、様々な技術が発見されています。その中でも、GAN(がん)は高画質の画像生成などに効果があり、非常に注目されている技術です。
これからどのように活用されるのか、どのような場面で利用されるのか注目してご覧下さい。

ちなみに、GAN(がん)についてもう少し理解を深めたい人は、下記の動画がおすすめです。


参考になったら「いいね!」と「シェア」をお願いします!!

このエントリーをはてなブックマークに追加
AI(人工知能)セミナー開催中