- 데이터 늘리기 (확대, 색바꾸기, 좌우반전, 회전, 밝게, flip, 잘라내기)
- 적용 이유 : 데이터 양이 늘어남, 다양한 상황에 대해 예측가능, 과적합방지
- 주의할 점 : 데이터의 원형정보를 손상시킬 정도로 변경하면 학습에 방해가 됨, 훈련(train)데이터에만 적용
ex) 숫자 6을 뒤집으면 9가 됨. 자율주행 자동차인데 땅을 뒤집어서 하늘이 위치하게 할 필요는 없음, 장미를 너무 확대시켜서 빨간색만 나오면 어떤 사진인지 알 수 없게 됨
down sampling
- pooling : 차원축소, conv
- unpooling
- max unpooling
- Transpose Convolution : 필터를 사용해서 차원을 늘려나감(가중치 활용해서 이미지에 손상이 적음)
- bed nails
-
- image crop cnn / cnn crop
- 작동방식의 특징 : 객체가 있을만한 곳을 탐색(selective search)해서 이미지를 잘라내고
각각 CNN을 돌려 나온 결과(class)를 분류
- 단점 : 시간이 오래걸린다
- Fast R-CNN, Faster R-CNN : rcnn이 각각 잘라서 돌려서 오래걸린다고 판단해서 보완
위치를 기억만 하고 이미지를 한번에 cnn에 넣고 자름. (rcnn과 비교했을때 cnn, crop의 순서가 바뀜)
Instance Segmentation
segmentation : 이미지를 픽셀단위로 클래스 분류. 분할차이. 뭉쳐있으면 구분 안됨
- sementic : 클래스만 분류 (의미단위)
- instance : 같은 클래스라도 독립된 개체면 각각 다르게 표현 (객체단위)
Semantic Segmentation : FCN
Object Recognition : 박스형태로 이미지 인식 (YOLO, Fast RCNN)
keypoint detection :
U-net : 바이오메디컬분야에 사용 목적으로 탄생
- segmentation
- 이유 : u모양이어서. (down sampling + up sampling)
padding이 없다 + skip connection (down과 up 의 같은 단계) -> crop
TIP >>
Transformer 번역이 어려우면 그 다음 나온 기능 Bert를 보면 사전요약이 되어있다
영어 강의가 어려우면 핵심 주제만 먼저 찾아보고 그다음 볼 것