728x90
zero shot에 관한 논문을 보던 중, capsule network를 처음 접하게 되었다.
관련 자료를 찾아보며 짧게 이해할 수 있도록 정리하였다.
Capsule Network
- capsule network : CNN에서 pooling의 문제(max, average..)를 극복할 수 있게 만들어졌다.
pooling 문제의 예시로는 max pooling이 있다. max pooling은 pooling 시 가장 큰 값만 사용하므로, 가치있는 정보를 잃어버리는 문제가 있다.
- Neuroscience에서 영감을 얻어 인간의 뇌와 같은 module을 가진다.
- Image rotation 문제를 해결하기 위해, 위치, 색상, 크기, 방향, 속도, 텍스쳐 등의 dynamic한 방법을 이용하였다.
기존의 CNN과 비교하자면 "affine transformation"의 유뮤이다.
capsule network의 affine 변환은 선형 변환 중 하나로, 점, 직선, 평면을 보존한다. 즉, 평행선이 보존된다.
728x90
반응형
'Paper Review > Zero Shot & Few Shot' 카테고리의 다른 글
ALP: Data Augmentation Using Lexicalized PCFGs for Few-Shot Text Classifcation (0) | 2023.08.29 |
---|---|
AugGPT : Leveraging ChatGPT for Text Data Augmentation (0) | 2023.08.28 |
[2022] Embedding Hallucination for Few-Shot Language Fine-tuning (4) | 2022.10.04 |
[2022] Learn to Adapt for Generalized Zero-Shot Text Classification (0) | 2022.07.13 |
Few Shot (with Meta-learning) (0) | 2022.07.13 |