til/dl

Few-shot Learning (metric-based)

2021. 6. 23. 20:57

[Attention] Soft-Attention과 Hard-Attention 차이 (2)	2022.02.04
비선형 활성화 함수의 사용 (Non-linear Activation Function) (0)	2021.06.28
Transfer learning, Multi-task learning, Meta learning, Few-shot learning (0)	2021.06.23
Apple paper 모음 (1)	2021.03.04
CNN 의 특징 3가지 (0)	2021.02.25

Hard parameter sharing	Soft parameter sharing
작업별 출력레이어를 유지하면서 히든 레이어 공유	각 작업에 대응하는 매개변수를 갖는 고유한 모델 존재
동시에 학습하는 작업이 많을 수록 과적화될 가능성 낮아짐	각 모델 매개변수 사이의 거리를 정규화하여 각 매개변수가 유사하도록 유도
	Constrained layer들 사용, "공유하는 부분만 공유하자"
(나머지 내용은 8주차 참고)

0. Intro