An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale (Vision Transformer) 논문에 제시된 architecture를 확인하여 코드로 직접 구현해봅시다. (심화-1) 과제에서 직접 실습해 보실 수 있습니다.