GAN(敵対的生成ネットワーク)とは?仕組みや特徴、活用事例まで徹底解説

こんにちは、AI研究所のマサミです。
さまざまなメディアに触れていると、昔の白黒写真がカラーになっていたり、もう実在しない人の顔が再現されたりしているのを、見たこともあるかもしれませんね。
実はそれらは、最近進化するディープラーニング(深層学習)の技術の中でも注目されているGAN(敵対的生成ネットワーク)によるものです。
GAN(がん)によって今までできなかったことが可能になっていますが、いったいどんな技術なのでしょうか。
ここでは、GAN(がん)について説明していきます。
当サイトでは、ディープラーニング関連の入門者向け記事をいくつかアップしております。GANよりも、まずディープラーニングのことから知りたいという方は、下記の記事から読むことをおすすめします。

ディープラーニングとは?初心者でもわかるディープラーニングの仕組みまとめ

また、こちらの記事ではディープラーニングのアルゴリズムについての情報をまとめております。一覧に本記事でご紹介するGAN(がん)もアルゴリズムの1つに入っていますので、こちらもぜひ参考にしてみてください。

ディープラーニングのアルゴリズムまとめ

GAN(がん)とは

GANとは「Generative Adversarial Networks」の頭文字を取った言葉で、「敵対的生成ネットワーク」ともいわれています。
この言葉は、GANが2つのネットワークを競わせて、入力したデータや情報の学習を深めることからきています。
コンピュータに大量のデータや情報を読み込ませ、アルゴリズムによって分析させるのです。
事例となる特徴を学習させることでパターンを見つけ出させます。
機械学習には2つのモデルがあります。その1つは入力したデータ画像が何かをコンピュータに判断させるモデルです。
そしてもう1つが生成モデルといわれる、入力したデータから新しく擬似データを作るモデルです。
GAN(がん)はその生成モデルの1つで入力されたデータや情報の特徴を学習していくことで、新たに実在しないデータや情報を作ったり、その特徴に近づけて作り出します。
下記の動画でも、入門者向けにGANについてわかりやすく説明がありますので、こちらもご覧になってみてはいかがでしょうか。
少々専門用語が多めですが、ディープラーニングについて学習をされている方なら、理解しやすいでしょう。

GAN(がん)の主な使いみち
GANによる画像生成

GAN(がん)の使いみちとしては画像生成が特に有名です。
データや情報を生成するということで、ディープラーニング(深層学習)を補うことができるのです。
今までは、データや情報を増やすために、サンプル画像を用意して色を変えたり傾けたりしてきました。しかし、GAN(がん)の技術によって、新たに特徴を持ったデータが作り出せるので、データ不足に陥りがちなディープラーニングにも応用することができるのです
「独自の特徴を持ったデータを増やす」ということから、音声を生成したり、新しい画像を作ったり、低解像度の画像を変換して高解像度にしたりすることにも期待が持てるようになりました。
少し内容は難しいと思いますが、ひとまずGANは画像処理と相性が良いと覚えておきましょう。

GAN(がん)の仕組みとは

GAN(がん)は「敵対的」生成ネットワークといわれるように、競い合う仕組みになっています。
Generator(ジェネレーター)とDiscriminator(ディスクリミネイター)という2つのネットワークがあり、最終的には本物とほとんど変わらないデータ・情報を作成するために、いたちごっこのように競り合うのです。
ジェネレーターは、本物そっくりに描こうとする贋作師、ディスクリミネイターはそれを判別する鑑定士に例えてみましょう。
贋作師のジェネレーターは、元にした絵画(入力データ)から特徴を捉えて似せた「贋作」を作成し、鑑定士であるディスクリミネイターは、ジェネレーターの偽物を「本物の絵画」と比較することで判別します。
このように、生成するネットワークと識別するネットワークの相互作用によって、少しずつデータは本物に近いものになっていきます。
初期の段階では、一目見ただけで偽物とわかるような質の低い絵画を作っているので、すぐに違いを見破られてしまいます。
すると贋作師は、前よりも似せたものを作り出して鑑定士をだまそうとします。
徐々に繰り返すうちに、本物にそっくりなものを作成してくるので、鑑定士も判断するのが難しくなってくるのです。
最後には鑑定士が本物だと判断する偽物を作り出すことが目標となっているのです。
ジェネレーターとディスクリミネイターが競い合うことで、最終的には本物と見間違えるほどのレベルまで生成データを持っていきます。
これからはGANで生成された画像は画質だけでなく、本物と相違のないレベルの高い画像が生成されるでしょう。

GAN(がん)の活用事例

GAN(がん)を利用して様々な研究が進み、情報やその用途も増えてきています。
ここからは、GANを活用して何ができるのか紹介していきます。

高品質の画像を作る

高画質の画像生成
まずは、高品質の画像を作り出せることです。
データサンプルを与えて低品質の画像から高い解像度のデータに仕上げていきます。
また、いくつかの顔の画像を取り入れて、実際には存在しない人の顔画像を作り出すことも行われています。
ファッションやアニメなどの分野では、こうした用途でGANの実用に向けた取り組みがされています。

文章から画像を起こす

画像をテキストなどの情報から生成することも可能です。
活用され始めた頃は荒い画像でしたが、現在ではだんだんと質の高い画像を生成できるようになってきました。
これにより、音声で写真の修正ができたり、脚本からアニメ映画を作ることも期待できます。

画像を翻訳する

1つの画像から違う雰囲気の画像に翻訳することも行われています。
例えば、ラフで描いたスケッチを漫画家が描いたような作品に仕上げたり、風景写真を印象派の作品のようなイメージに仕上げることもできそうです。
これから技術を使って画像を生成するのであれば、GAN(がん)は利用する価値があると言えるでしょう。

動画を翻訳する

動画から動画へと翻訳する技術も高くなっています。
2人の全く違う別人をシンクロするように同じ動きにする動画も作られています。
この技術を使って、生存していない女優や歌手がテレビに登場する日も遠くないかもしれません。

画像の特定領域を変換する

画像の中にある特定のスペースを別のものに自然に変換する手法もあります。
ツールを使うことで、画像内のある部分のみを変換することができるのです。
例えば、ファッションモデルの画像では履いているものを、パンツからスカートに変えるということも可能になります。

スタイルを変換処理する

GANによる画像スタイルの変換

GANを使えば、2つの異なる画像を交換することもできるのです。
例えばウマとシマウマの画像では、ウマがシマウマに変わったり、その反対にシマウマがウマになったりできるのです。

GAN(がん)の応用研究とは

GAN(がん)の強みを活かした応用研究が開発されています。
ここからは、その研究にはどんなものがあるのかを紹介します。

DCGANとは

オリジナルのGAN(がん)では、データを作るのがメインですが、DCGANは、画像の生成が優れています
深いネットワークになっても安定した学習ができるようになり、オリジナルのGANに比べてさらにはっきりと鮮明な画像を生成することが可能になりました。

CycleGANとは

CycleGANは、無関係な2枚の写真を用いて、その特徴を似せ合うようにネットワークを構築します。
例えば風景写真とデータを組み合わせて、若葉を紅葉にしたり、夏っぽいイメージから冬っぽいイメージに変えるなど、季節を入れ替えることもできます。

StyleGANとは

StyleGANは、リアルな写真生成を可能にしたことで、注目が集まりました。
StyleGANはそれまでのジェネレーターの構造を大きく変えたのです。
入力するのに不要な情報を一度別のところでマッピングして、そこで得た情報をジェネレーターに入力しました。
これにより画像の不要な情報は柔軟に調整することができるようになり、様々な画像が思い通りに作成できるようになったのです。
そしてとてもリアルな高品質な画像も作成可能になっています。

GAN(がん)のメリットやデメリットとは

ここまでGANとは何か、活用事例までも含めご紹介しました。しかし、まだまだいまいち特徴が掴めないという方もいるでしょう。
そこで、ここからは、GAN(がん)にはどんな特徴があるのか、メリットとデメリットに分けてみていきます。

GAN(がん)のメリット

GANのメリット

まずは、GANのメリットを4つに厳選して解説していきます。
これから紹介するメリットを把握すれば、GANの利便性や機能をより深く理解できるようになるでしょう。

GANを使って新しいデータや情報を作れる

GAN(がん)は、従来の角度や色を変えたりするだけではない、サンプルの特徴を持った新しいデータや情報が作れます。既存の画像の複製ではなく、全く異なる新しいデータを生成できるのは大きなメリットと言えるでしょう。

GANでは画像を高画質にできる

既存の方法に比べて、GAN(がん)を利用することで画像を高画質にすることが可能です。
現在はどんな画像でも画質に拘る人が非常に多い為、GAN(がん)の画像を高画質にできるという技術は、世界中の人にとって非常に大きな価値と言えるでしょう。
これからもmGANの技術によって画像がさらに高画質になると予測されています。

GANと他の技術との合わせ技が可能

GANはword2vecの技術と組み合わせることで、画像ラベルから演算が行えるようになりました。
例えば、「サッカーをしている子供ー子供+プロサッカー選手=サッカーをしているプロサッカー選手」という演算から、サッカーをしているプロサッカー選手の画像を生成することが可能なのです。
現在は簡単な演算のみで画像が生成できるようになっていますが、将来的には複雑な演算でも適切な画像を作成できるようになると言われています。
また他にも様々な技術と合わせ技ができるようになることも期待できます。そうなれば、GAN(がん)の利用用途はさらに増えるでしょう。

医療で利用できる可能性がある

GAN(がん)の技術は画像だけでなく、医療の現場でも採用される可能性があります。
医療現場の検査などでGANを利用されることになれば、より多くのデータや情報収集に役立つと言われているようです。
現在の多くの医療の現場は、患者を検査した際に撮った写真でのみデータを収集しています。そこにGAN(がん)の技術を使うことで多くの写真をデータ・情報を収集できるので、新しい療法の発見にも使うことができるでしょう。

GAN(がん)のデメリット

GANのデメリットここまではGAN(がん)を利用するメリットを紹介しましたが、GANにはデメリットもあります。デメリットを知ることで、より有用なGANの活用ができるはずですから、こちらも確認しておきましょう。

判断基準が不透明

コンピュータが作成した画像データを、どのような基準で「似ている」とするのか判断するのは、非常に難しいです。
「似ている」という判断基準が不透明なことによって、人の価値観によっては全く似ていない画像が完成する可能性も十分に考えられます。
しかしながら、これから技術が進歩していけば、判断基準の精度が少しずつ良くなると予測されている為、大きなデメリットとは言えないでしょう。

GANは動作の不具合が多い

GAN(がん)は素晴らしい技術ですが、動作の不具合が多く、安全に利用できるかと考えれば少し不安が残ります。
たとえば、下記のようなエラーがあるのです。

  • 勾配消失問題:初めは簡単に判別ができるため学習が十分に行われない
  • モード崩壊:だませるようになったら今度はその特徴を持つ画像しか生成しなくなる

上記2つは、GAN(がん)を利用する際に最も注意しなければならないエラーです。
これからGAN(がん)の利用を考えている人は、「勾配消失問題」や「モード崩壊」などのエラーが起きた時に、どのように処理するのか検討しておきましょう。

GAN(がん)は画像生成に欠かせない

GANは画像生成に欠かせない存在

GAN(がん)は、Generator(ジェネレーター)とDiscriminator(ディスクリミネイター)という2つのネットワークを競わせることで、入力したデータの学習を深めていくので「敵対的生成ネットワーク」ともいわれています。
活用例では、高品質の画像を作ったり、2つの画像のスタイルを変換することもできます。
応用研究としては、若葉を紅葉にできる「CycleGAN」や「StyleGAN」などがあります。これからも研究は継続されるはずですから、今後の技術進歩にも注目ですね。

GANについて:まとめ

本記事では、GAN(がん)の仕組みや特徴、活用事例などを徹底解説しました。
近年はIT技術の進歩が非常に早く、様々な技術が発見されています。その中でも、GAN(がん)は高画質の画像生成などに効果があり、非常に注目されている技術です。
これからどのように活用されるのか、どのような場面で利用されるのか注目してご覧下さい。
ちなみに、GAN(がん)についてもう少し理解を深めたい人は、下記の動画がおすすめです。

最新情報をチェックしよう!
>企業向けAI人材育成サービス

企業向けAI人材育成サービス

AI事業発足やAI導入に必要な人材育成のステップとAI研究所が提供するサービス。AI研究所の人材育成サービスでは、3つのステップを軸に御社の業務内でAIを活用できる人材育成やAIプロジェクトの支援を行います。

CTR IMG