상세 컨텐츠

본문 제목

[딥러닝] 이미지 분할, 데이터 증강, 객체 인식, RCNN

카테고리 없음

by simplecode 2021. 8. 25. 11:52

본문

이미지 분할(Image Segmentation)

데이터 증강 (Data Augmentation)

- 데이터 늘리기 (확대, 색바꾸기, 좌우반전, 회전, 밝게, flip, 잘라내기)

- 적용 이유 : 데이터 양이 늘어남, 다양한 상황에 대해 예측가능, 과적합방지

- 주의할 점 : 데이터의 원형정보를 손상시킬 정도로 변경하면 학습에 방해가 됨, 훈련(train)데이터에만 적용

ex) 숫자 6을 뒤집으면 9가 됨. 자율주행 자동차인데 땅을 뒤집어서 하늘이 위치하게 할 필요는 없음, 장미를 너무 확대시켜서 빨간색만 나오면 어떤 사진인지 알 수 없게 됨

객체 인식 (Object Recognition) : 사전 학습된 이미지 분류 신경망을 사용하여 다중 객체 검출하기

down sampling

- pooling : 차원축소, conv

 

upsampling : 다운샘플링으로 축소된 이미지를 원래 크기로 복원하는 것

- unpooling

- max unpooling

- Transpose Convolution : 필터를 사용해서 차원을 늘려나감(가중치 활용해서 이미지에 손상이 적음)

-  bed nails

 

RCNN :  object detection(상자로 객체 표시)

- image crop cnn / cnn crop

- 작동방식의 특징 : 객체가 있을만한 곳을 탐색(selective search)해서 이미지를 잘라내고

각각 CNN을 돌려 나온 결과(class)를 분류

- 단점 : 시간이 오래걸린다

 

- Fast R-CNN, Faster R-CNN : rcnn이 각각 잘라서 돌려서 오래걸린다고 판단해서 보완

위치를 기억만 하고 이미지를 한번에 cnn에 넣고 자름. (rcnn과 비교했을때 cnn, crop의 순서가 바뀜)

 

 

Instance Segmentation

segmentation : 이미지를 픽셀단위로 클래스 분류. 분할차이. 뭉쳐있으면 구분 안됨

- sementic : 클래스만 분류  (의미단위)

- instance  : 같은 클래스라도 독립된 개체면 각각 다르게 표현 (객체단위)

Task - 신경망모델

 

Semantic Segmentation : FCN

Object Recognition : 박스형태로 이미지 인식  (YOLO,  Fast RCNN)

keypoint detection :

 

U-net : 바이오메디컬분야에 사용 목적으로 탄생

- segmentation

- 이유 : u모양이어서. (down sampling + up sampling)

padding이 없다 + skip connection (down과 up 의 같은 단계) -> crop 

 

TIP >>

Transformer 번역이 어려우면 그 다음 나온 기능 Bert를 보면 사전요약이 되어있다

영어 강의가 어려우면 핵심 주제만 먼저 찾아보고 그다음 볼 것