현재 진행 중(2020.12.7~2020.12.12)인 머신러닝 3대 학회 중 하나인 NeurlIPS 2020에 NVIDIA가 Augmentation에 대해 새로운 패러다임을 제시하면서 또 하나의 이슈를 만들었다.
논문 제목에서 알 수 있듯이 적은 양의 데이터로도 GAN을 학습할 수 있는 기법이고, 그 기법의 이름은 적응형 판별기 증강(Adaptive Discriminator Augmentation, ADA)이다.
원래도 Augmentation이란 한정된 데이터를 늘리기 위해 rotation. flip, crop 등의 방법을 이용하는 방법인데, 이것을 독창적인 방법으로 적용해봤다고 한다.
이 논문에 대한 요약은 다음과 같다.
- Augmentation의 종류를 6개 카테고리로 나눠서 해당 카테고리의 augmentation 적용의 강도를 'p'라는 파라미터로 매 iteration마다 조정하여 학습에 적용
- 6개 augmentation 카테고리 : pixel blitting(x-flips, rotations, integer translation), more general geometric transformations, color transformations, image-space filtering, additive noise, and cutout
- 이를 기존의 생성 모델인 StyleGAN2에 적용하여 적은 데이터로도 뛰어난 생성 성능을 보여줌(적은 데이터로 10배, 20배 많은 데이터로 학습시킨 효과를 볼 수도 있다고 함)
- 기존에는 적은 데이터를 사용하면 overfitting의 확률이 높아졌는데, 'p' 자체를 overfitting의 정도에 따라 조정하기 때문에 적은 데이터로도 좋은 효과를 보여줌.
적용 case
- 데이터를 구하기 힘든 의학, 예술 등의 분야에서 적은 데이터만 이용 가능한 경우
- 데이터가 방대하여 학습 시간이 너무 오래 걸리는 경우 데이터를 줄여서 학습 가능
기사 링크 : www.aitimes.kr/news/articleView.html?idxno=18596
Github 링크 : github.com/NVlabs/stylegan2-ada
논문 링크 : arxiv.org/pdf/2006.06676.pdf