< Conditional Generative Adversarial Nets >
"GAN + Condition y"
0. Abstract
이 논문에서는 conditional 버전의 GAN에 대해서 설명할 것이다. 이는 간단하게
1. Introduction
Unconditioned generative model에서는 데이터가 생성되는데에 통제권이 없다. 하지만 추가적인 정보를 모델에 입력하여 conditioning하면 데이터 생성과정에 영향을 미칠 수 있다. 이러한 conditioning은 클래스 라벨, 인페인팅 데이터의 일부 부분 또는 심지어 다른 양식의 데이터에 기반할 수 있다.
클래스 라벨에 conditioned된 MNIST 데이터 세트와 다중모드 학습을 위한 MIR Flickr 데이터셋에 실험을 할 것이다.
2. Related Work
3.1 Multi-modal Learning For Image Labelling
- 여전히 매우 많은 예측 결과 카테고리를 수용하기 위해 모델을 확장하는 것은 어려운 일이다.
- 두 번째 문제는 지금까지 대부분의 작업이 입력에서 출력으로의 일대일 매핑을 학습하는데 초점을 맞췄다는 것이다.
하지만 많은 흥미로운 문제들은 자연적으로 확률론적 일대다 매핑으로 생각되어진다. 예를 들어, 이미지 라벨링의 경우 주어진 이미지에 적절하게 사용될 수 있는 서로 다른 다양한 태그들이 있으며, 다른 사람들이 동일한 이미지를 설명하기 위해 다른 용어를 사용할 수 있다.
첫 번째 문제를 해결하는데 도움이 되는 한 가지 방법은 다른 유형의 추가 정보를 활용하는 것이다. 예를 들어, 기하학적 관계가 의미론적으로 의미 있는 라벨에 대한 벡터 표현을 학습하기 위해 자연어 말뭉치를 사용하는 것과 같다. 그러한 공간에서 예측을 할 때, 예측 오류가 있을 때 종종 실제와 ‘가까워’있다는 사실에서 이익을 얻는다.
Deep Visual-Semantic Embedding Model에서는 이미지 특징 공간으로부터 단어 표현 공간까지의 간단한 선형 매핑으로도 분류 성능을 향상시킬 수 있다고 보여줬다.
두 번째 문제를 해결하기 위한 방법으로는 conditional probability generative model을 사용하는 것이다. 입력은 conditioning 변수로 간주되고 일대다 매핑은 conditional predictive distribution으로 인스턴스화된다.
3. Conditional Adversarial Nets
3.1 Generative Adversarial Nets
GAN은 generative model을 학습하기 위한 방법으로 최근에 소개되어졌다. generator
데이터
3.2 Conditional Adversarial Nets
GAN은 generator & discriminator 모두 추가적인 정보
Generator에서 prior input noise인
Discriminator에서
목적 함수는 다음과 같다.
Fig.1은 간단한 CGAN의 구조를 보여준다.
4. Experimental Results
4.1 Unimodal
논문에서는 CGAN을 one-hot 벡터들로 인코딩된 클래스 라벨에 conditioned된 MNIST 이미지들에 대해 학습했다.
Generator net에서는 단위 하이퍼큐브 내의 균일한 분포에서 100 차원의 noise prior
Discriminator는
- SGD with mini-batch size = 100
- 초기 Learning_rate = 0.1 ~ 0.000001 ( 1.00004배의 속도로 하강 )
- Momentum = 초기 0.5에서 0.7로 증가
- Dropout = 0.5 (G,D 모두)
4.2 Multimodal
Flickr와 같은 사진 사이트는 이미지 및 관련 사용자가 생성한 메타데이터(UGM : User Generated Metadata)의 풍부한 레이블링 데이터가 있다.
UGM의 경우 동의어가 널리 퍼져있다. 즉 사용자마다 동일한 개념을 설명하기 위한 용어를 서로 다르게 쓸 수 있다는 것이다. 결과적으로 이러한 라벨을 정상화하는 효율적인 방법을 갖는 것이 중요해진다. 개념적인 word embedding은 관련 개념들이 결국 유사한 벡터에 의해 표현되기 때문에 여기서 유용할 수 있다.
모델 구조는 논문을 읽으면 알 수 있다.
5. Future Work
논문에서 보여진 결과는 극도로 초기 단계이지만, CGAN의 잠재력을 증명했고, 흥미롭고 유용한 적용에 대한 가능성을 보여준다.
CGAN은 condition variable
논문에서 중점은 GAN에 condition을 추가하는 것 만으로도 원하는 결과를 얻을 수 있다는 것을 보여주었다는 것이다.