AI研究所 - AI(人工知能)に脅かされないために、AI(人工知能)を作る側の人間になる -

HOME  >  GAN(敵対的生成ネットワーク)とは?仕組みや特徴、活用事例まで徹底解説

公開日:2020.06.30 [最終更新日]2020.07.09

GAN(敵対的生成ネットワーク)とは?仕組みや特徴、活用事例まで徹底解説

AI(人工知能)の知識

昔の白黒写真がカラーで再生されたり、もう実在しない人の顔が再現されることがあります。
それは、最近進化するディープラーニングの技術の中でも注目されているGAN(敵対的生成ネットワーク)によるものです。
GANによって今までできなかったことが可能になっていますが、いったいどんな技術なのでしょうか。
ここでは、GANについて説明していきます。

GANとは

GANは2つのネットワークを競わせて、入力したデータの学習を深めるので「敵対的生成ネットワーク」ともいわれています。
コンピュータに大量のデータを読み込ませ、アルゴリズムによって分析させるのです。
事例となる特徴を読み込ませることでパターンを見つけ出させます。
機械学習には2つのモデルがあり、その1つは入力したデータ画像が何かをコンピュータに判断させるモデルです。
もう1つが生成モデルといわれる、入力したデータから新しく擬似データを作るモデルです。
GANはその生成モデルの1つで入力されたデータの特徴を学習していくことで、新たに実在しないデータを作ったり、データの特徴に近づけて作り出します。

GANの使いみちとしては画像生成が有名です。
データを生成するということで、ディープラーニングを補うことができます。
今までは、データを増やすために、サンプル画像を用意して色を変えたり傾けたりしてきましたが、新たに特徴を持ったデータが作り出せるので、データ不足に陥りがちなディープラーニングにも応用することができます。
「独自の特徴を持ったデータを増やす」ということから、音声を生成したり、新しい画像を作ったり、低解像度の画像を変換して高解像度にしたりすることに期待が持てるようになりました。

GANの仕組みとは

GANは「敵対的」生成ネットワークとあるように、競い合う仕組みになっています。
Generator(ジェネレーター)とDiscriminator(ディスクリミネイター)という2つのネットワークがあり、最終的には本物とほとんど変わらないデータを作成するために、いたちごっこのように競り合うのです。
ジェネレーターは、本物そっくりに描こうとする贋作師、ディスクリミネイターはそれを判別する鑑定士に例えてみます。
贋作師のジェネレーターは、元にした絵画(入力データ)から特徴を捉えて似せた「贋作」を作成し、鑑定士であるディスクリミネイターは、ジェネレーターの偽物を「本物の絵画」と比較することで判別します。
このように、生成するネットワークと識別するネットワークの相互作用によって、少しずつデータは本物に近いものになっていきます。

初期の段階では、一目見ただけで偽物とわかるような質の低い絵画を作っているので、すぐに違いを見破られてしまいます。
すると贋作師は、前よりも似せたものを作り出して鑑定士をだまそうとします。
徐々に繰り返すうちに、本物にそっくりなものを作成してくるので、鑑定士も判断するのが難しくなってくるのです。
最後には鑑定士が本物だと判断する偽物を作り出すことが目標となっているのです。
ジェネレーターとディスクリミネイターが競い合うことで、最終的には本物と見間違えるほどのレベルまで生成データを持っていきます。

GANの活用事例

GANを利用して様々な研究が進み、その用途も増えてきています。
何ができるのか紹介していきます。

高品質の画像を作る


まずは、高品質の画像を作り出せることです。
データサンプルを与えて低品質の画像から高い解像度のデータに仕上げていきます。
また、いくつかの顔の画像を取り入れて、実際には存在しない人の顔画像を作り出すことも行われています。
ファッションやアニメなどの分野では実用に向けた取り組みがされています。

文章から画像を起こす

画像をテキストから生成することも可能です。
最初は荒い画像でしたがだんだんと質の高い画像を生成できるようになってきました。
これにより、音声で写真の修正ができたり、脚本からアニメ映画を作ることも期待できます。

画像を翻訳する

1つの画像から違う雰囲気の画像に翻訳することも行われています。
例えば、ラフで描いたスケッチを漫画家が描いたような作品に仕上げたり、風景写真を印象派の作品のようなイメージに仕上げることもできそうです。

動画を翻訳する

動画から動画へと翻訳する技術も高くなっています。
2人の全く違う別人をシンクロするように同じ動きにする動画も作られています。
生存していない女優や歌手がテレビに登場する日も遠くないかもしれません。

画像の特定領域を変換する

画像の中にある特定のスペースを別のものに自然に変換する手法もあります。
ツールを使うことで、画像内のある部分のみを変換することができます。
例えば、ファッションモデルの画像では履いているパンツからスカートに変えるのも可能になります。

スタイルを変換する

2つの異なる画像を交換することもできるのです。
例えばウマとシマウマの画像では、ウマがシマウマに変わったり、その反対にシマウマがウマになったりできるのです。

GANの応用研究とは

GANの強みを活かした応用研究が開発されています。
その研究を紹介します。

DCGANとは

オリジナルのGANでは、データを作るのがメインですが、DCGANは、画像の生成が優れています。
深いネットワークになっても安定した学習ができるようになり、GANに比べてさらにはっきりと鮮明な画像を生成することが可能になりました。

CycleGANとは

CycleGANは、無関係な2枚の写真を用いて、その特徴を似せ合うようにネットワークを構築します。
例えば風景写真とデータを組み合わせて、若葉を紅葉にしたり、夏っぽいイメージから冬っぽいイメージに変えるなど季節を入れ替えることもできます。

StyleGANとは

StyleGANは、リアルな写真生成を可能にし、注目が集まりました。
StyleGANはそれまでのジェネレーターの構造を大きく変えたのです。
入力するのに不要な情報を一度別のところでマッピングして、そこで得た情報をジェネレーターに入力しました。
これにより画像の不要な情報は柔軟に調整することができるようになり、様々な画像が思い通りに作成できるようになったのです。
そしてとてもリアルな高品質な画像も作成可能になっています。

GANのメリットやデメリットとは

それではGANにはどんな特徴があるのか見ていきます。

GANのメリット

GANは、従来の角度や色を変えたりすることではない、サンプルの特徴を持った新しいデータが作れます。
word2vecを共に利用するなど他の技術との組み合わせによって、合わせ技ができるようになったのです。
また画像の名前から演算もできます。
他には、それまでの方法よりもリアルな高品質の画像が作れるようになりました。

GANのデメリット

コンピュータが作成した画像データをどのような基準で「似ている」とするのか判断が難しいことです。
またオリジナルのGANは動きが不安定になりやすいことが挙げられます。
はじめは簡単に識別できるので、十分に学習をしなかったり、学習が進んで騙せるようになると、次からはその特徴のある画像しか作らなくなります。

GANは画像生成に欠かせない

GANは、Generator(ジェネレーター)とDiscriminator(ディスクリミネイター)という2つのネットワークを競わせることで、入力したデータの学習を深めていくので「敵対的生成ネットワーク」ともいわれています。
活用例では、高品質の画像を作ったり、2つの画像のスタイルを変換することもできます。
応用研究としては、若葉を紅葉にできる「CycleGAN」や「StyleGAN」などがあります。


参考になったら「いいね!」と「シェア」をお願いします!!

このエントリーをはてなブックマークに追加
AI(人工知能)セミナー開催中