GANとは何?できることや仕組み・活用事例を分かりやすく解説

最近進化するディープラーニング(深層学習)の技術の中でも注目されているGAN(敵対的生成ネットワーク)は、今後のAI技術には欠かせないとても優れた技術です。
例えば白黒写真をカラーにすることができたり、絵画の描かれていない外側を自動生成することができたりします。
世界はGAN(ガン)によって今までできなかったことが可能になっていますが、いったいどんな技術なのでしょうか。

GAN(ガン)とは

GANとは

GANとは「Generative Adversarial Networks」の頭文字を取った言葉で、「敵対的生成ネットワーク」ともいわれています。
この言葉は、GANが2つのネットワークを競わせて、入力したデータや情報の学習を深めることからきています。
コンピュータに大量のデータや情報を読み込ませ、アルゴリズムによって分析させるのです。
事例となる特徴を学習させることでパターンを見つけ出させるAI技術となっています。

下記の動画でも、入門者向けにGANについてわかりやすく説明がありますので、こちらもご覧になってみてはいかがでしょうか。
少々専門用語が多めですが、ディープラーニングについて学習をされている方なら理解しやすいでしょう。

GAN(ガン)でできること

GAN(ガン)でできることとしては自動の画像生成が特に有名です。

今までは、データや情報を増やすために、サンプル画像を用意して色を変えたり傾けたりしてきました。しかし、GAN(ガン)の技術によって、新たに特徴を持ったデータが作り出せるので、データ不足に陥りがちなディープラーニングにも応用することができるのです。
「独自の特徴を持ったデータを増やす」ということから、音声を生成したり、新しい画像を作ったり、低解像度の画像を変換して高解像度にしたりすることにも期待が持てるようになりました。

少し内容は難しいと思いますが、ひとまずGANは画像処理と相性が良いと覚えておきましょう。

皆さんが気軽に利用できる「画像生成AI」に関してはこちらの記事でも解説しています。

画像生成AIとは?その仕組みやメリットデメリット・活用事例

ディープラーニングやGANについて学べるおすすめのセミナー!

Proskilllが開催しているAIエンジニア育成講座は、3日間集中講座で会場・ライブウェビナー・eラーニングの3つのタイプから受講を選択でき、AIの発展知識や実装まで学べるセミナーとなっています。
セミナーの内容は、今回の記事でご紹介するディープラーニングやGANについてはもちろんのこと、AI基礎知識から、実務で使えるAIの実装技術と活用術まで習得できるおすすめのセミナーです!
もちろん非エンジニアの方でも、ゼロからAIプログラムの実装方法を学ぶことができます。

GAN(ガン)の仕組みとは

GAN(ガン)は「敵対的」生成ネットワークといわれるように、競い合う仕組みになっています。
Generator(ジェネレーター)とDiscriminator(ディスクリミネイター)という2つのネットワークがあり、最終的には本物とほとんど変わらないデータ・情報を作成するために、いたちごっこのように競り合うのです。
ジェネレーターは、本物そっくりに描こうとする贋作師、ディスクリミネイターはそれを判別する鑑定士に例えてみましょう。
贋作師のジェネレーターは、元にした絵画(入力データ)から特徴を捉えて似せた「贋作」を作成し、鑑定士であるディスクリミネイターは、ジェネレーターの偽物を「本物の絵画」と比較することで判別します。

このように、生成するネットワークと識別するネットワークの相互作用によって、少しずつデータは本物に近いものになっていきます。
初期の段階では、一目見ただけで偽物とわかるような質の低い絵画を作っているので、すぐに違いを見破られてしまいます。
すると贋作師は、前よりも似せたものを作り出して鑑定士をだまそうとします。
徐々に繰り返すうちに、本物にそっくりなものを作成してくるので、鑑定士も判断するのが難しくなってくるのです。
最後には鑑定士が本物だと判断する偽物を作り出すことが目標となっているのです。
ジェネレーターとディスクリミネイターが競い合うことで、最終的には本物と見間違えるほどのレベルまで生成データを持っていきます。
これからはGANで生成された画像は画質だけでなく、本物と相違のないレベルの高い画像が生成されるでしょう。

GAN(ガン)の活用事例

GAN(ガン)を利用して様々な研究が進み、情報やその用途も増えてきています。
ここからは、GANを活用して何ができるのか紹介していきます。

①特徴から高品質の画像を作り出す

①特徴から高品質の画像を作り出す

まずは、高品質の画像を作り出せることです。
データサンプルを与えて低品質の画像から高い解像度のデータに仕上げていきます。
また、いくつかの顔の画像を取り入れて、実際には存在しない人の顔画像を作り出すことも行われています。
ファッションやアニメなどの分野では、こうした用途でGANの実用に向けた取り組みがされています。

②文章から画像生成する

画像をテキストなどの情報から生成することも可能です。
活用され始めた頃は荒い画像でしたが、現在ではだんだんと質の高い画像を生成できるようになってきました。
これにより、音声で写真の修正ができたり、脚本からアニメ映画を作ることも期待できます。

③画像をルールに基づいて変更する

1つの画像から違う雰囲気の画像に変更することもGANですることができます。
例えば、ラフで描いたスケッチを漫画家が描いたような作品に仕上げたり、風景写真を印象派の作品のようなイメージに仕上げることもできそうです。
これから技術を使って画像を生成するのであれば、GAN(ガン)は利用する価値があると言えるでしょう。

④動画をルールに基づいて変更する

GANは動画から動画へと翻訳する技術も高くなっています。
2人の全く違う別人をシンクロするように同じ動きにする動画も作られています。
この技術を使って、生存していない女優や歌手がテレビに登場する日も遠くないかもしれません。

⑤画像の特定領域を変換する

画像の中にある特定のスペースを別のものに自然に変換する手法もあります。
GANの特別なツールを使うことで、画像内のある部分のみを変換することができるのです。
例えば、ファッションモデルの画像では履いているものを、パンツからスカートに変えるということも可能になります。

⑥スタイルを変換処理する

GANによる画像スタイルの変換

GANを使えば、2つの異なる画像を交換することもできるのです。
例えばウマとシマウマの画像では、ウマがシマウマに変わったり、反対にシマウマがウマになったりできるのです。

GAN(ガン)の応用編

最近ではGAN(ガン)を普通に使うだけでなく、さまざまな応用技術を生み出すエンジニアも増えています。
ここではGANの応用ではどのようなことができるのかを解説していきます。

DCGAN

オリジナルのGAN(ガン)ではデータを作るのがメインですが、DCGANは、画像の生成が優れています。
深いネットワークになっても安定した学習ができるようになり、オリジナルのGANに比べてさらにはっきりと鮮明な画像を生成することが可能になりました。

CycleGAN

CycleGANは、無関係な2枚の写真を用いて、その特徴を似せ合うようにネットワークを構築します。
例えば風景写真とデータを組み合わせて、若葉を紅葉にしたり、夏っぽいイメージから冬っぽいイメージに変えるなど、季節を入れ替えることもできます。

StyleGAN

StyleGANは、リアルな写真生成を可能にしたことで、注目が集まりました。
StyleGANはそれまでのジェネレーターの構造を大きく変えたのです。
入力するのに不要な情報を一度別のところでマッピングして、そこで得た情報をジェネレーターに入力しました。
これにより画像の不要な情報は柔軟に調整することができるようになり、様々な画像が思い通りに作成できるようになったのです。
そしてとてもリアルな高品質な画像も作成可能になっています。

GAN(ガン)を利用するメリット・デメリット

ここまでGANとは何か、活用事例までも含めご紹介しました。
しかし、まだまだいまいち特徴が掴めないという方もいるでしょう。
そこで、ここからは、GAN(ガン)にはどんな特徴があるのか、メリットとデメリットに分けてみていきます。

GAN(ガン)のメリット

まずは、GANのメリットを4つに厳選して解説していきます。
これから紹介するメリットを把握すれば、GANの利便性や機能をより深く理解できるようになるでしょう。

①GANを使って新しいデータや情報を作れる

GAN(ガン)は、従来の角度や色を変えたりするだけではない、サンプルの特徴を持った新しいデータや情報が作れます。
既存の画像の複製ではなく、全く異なる新しいデータを生成できるのは大きなメリットと言えるでしょう。

②GANでは画像を高画質にできる

既存の方法に比べて、GAN(ガン)を利用することで画像を高画質にすることが可能です。
現在はどんな画像でも画質に拘る人が非常に多い為、GAN(ガン)の画像を高画質にできるという技術は、世界中の人にとって非常に大きな価値と言えるでしょう。
これからもmGANの技術によって画像がさらに高画質になると予測されています。

③GANと他の技術との合わせ技が可能

GANはword2vecの技術と組み合わせることで、画像ラベルから演算が行えるようになりました。
例えば、「サッカーをしている子供ー子供+プロサッカー選手=サッカーをしているプロサッカー選手」という演算から、サッカーをしているプロサッカー選手の画像を生成することが可能なのです。
現在は簡単な演算のみで画像が生成できるようになっていますが、将来的には複雑な演算でも適切な画像を作成できるようになると言われています。
また他にも様々な技術と合わせ技ができるようになることも期待できます。そうなれば、GAN(ガン)の利用用途はさらに増えるでしょう。

④医療で利用できる可能性がある

GAN(ガン)の技術は画像だけでなく、医療の現場でも採用される可能性があります。
医療現場の検査などでGANを利用されることになれば、より多くのデータや情報収集に役立つと言われているようです。
現在の多くの医療の現場は、患者を検査した際に撮った写真でのみデータを収集しています。
そこにGAN(ガン)の技術を使うことで多くの写真をデータ・情報を収集できるので、新しい療法の発見にも使うことができるでしょう。

GAN(ガン)のデメリット

ここまではGAN(ガン)を利用するメリットを紹介しましたが、GANにはデメリットもあります。
デメリットを知ることで、より有用なGANの活用ができるはずですから、こちらも確認しておきましょう。

①判断基準が不透明

コンピュータが作成した画像データを、どのような基準で「似ている」とするのか判断するのは、非常に難しいです。
「似ている」という判断基準が不透明なことによって、人の価値観によっては全く似ていない画像が完成する可能性も十分に考えられます。
しかしながら、これから技術が進歩していけば、判断基準の精度が少しずつ良くなると予測されている為、大きなデメリットとは言えないでしょう。

②GANは動作の不具合が多い

GAN(ガン)は素晴らしい技術ですが、動作の不具合が多く、安全に利用できるかと考えれば少し不安が残ります。
たとえば、下記のようなエラーがあるのです。

  • 勾配消失問題:初めは簡単に判別ができるため学習が十分に行われない
  • モード崩壊:だませるようになったら今度はその特徴を持つ画像しか生成しなくなる

上記2つは、GAN(ガン)を利用する際に最も注意しなければならないエラーです。
これからGAN(ガン)の利用を考えている人は、「勾配消失問題」や「モード崩壊」などのエラーが起きた時に、どのように処理するのか検討しておきましょう。

GAN(ガン)についてまとめ

本記事では、GAN(ガン)の仕組みや特徴、活用事例などを徹底解説しました。
近年はIT技術の進歩が非常に早く、様々な技術が発見されています。
その中でも、GAN(ガン)は高画質の画像生成などに効果があり、非常に注目されている技術です。
これからどのように活用されるのか、どのような場面で利用されるのか注目してご覧下さい。

GAN(ガン)についてもう少し理解を深めたい人は、下記の動画がおすすめです。

AIのプログラミング方法やGANについてが学べるAIエンジニア育成講座はこちら

GANとは何?できることや仕組み・活用事例を分かりやすく解説
最新情報をチェックしよう!