신경망의 기본 구조는 입력층(input layers), 은닉층(hidden layers), 출력층(output layers) 으로 나뉩니다
입력층(Input Layers) - 데이터가 입력되는 공간. 계산없이 값만 전달하기 때문에 신경망의 깊이에 포함하지 않음. 위그림은 2층 구성.
노드의 개수 조절 불가
은닉층(hidden layers) - 연산이 진행되는 장소. 계산의 결과를 사용자가 볼 수 없게 숨겨져있음. 딥러닝은 2개이상의 은닉층 보유
노드의 개수 조절 가능
출력층(output layers) - 출력의 형태 결정. 대부분 활성함수(activation function)가 존재
> 회귀문제의 예측목표변수가 실수값이면 활성화 함수가 필요 없습니다.
> 이진분류는 시그모이드 함수를 사용하여 출력>확률값으로 변환하여 label 결정
> 다중클래스 분류시 소프트맥스 함수를 활성화 함수로 사용
신경망의 동작 원리는 다음과 같습니다.
1) 데이터 전처리
2) 입력 신호의 형태 결정
3) 모델(학습할 신경망구조 선택) 제작 및 가중치 초기화
4) 순방향 전파를 통한 출력값과 레이블(정답) 비교 후 Loss(비용함수) 계산
5) 역방향 전파를 통해 가중치별 편미분 값 업데이트(역전파 + 경사하강법)하여 Loss(비용함수)최소화
6) 어떤 중지 기준을 충족하거나 비용함수를 최소화 할 때까지 단계 2-5를 반복( 2-5 한세트 진행이 에포크 1회)
인공 신경망에서 전체 데이터에 대해서 순전파와 역전파가 끝난 상태를 말합니다.
비유를 한다면 문제와 정답이 있는 책(데이터)의 모든 문제와 정답채점까지 마쳐 책 한권에 대한 공부를 한번 끝낸 상태를 말합니다.
공부를 잘 하는 학생이라면 5번 10번이고 반복하여 배운내용에 대한 완성도를 올리게 되겠죠.
신경망의 역전파에서 레이블(abel, 타켓, target, y)값과 출력층에서 나오는 값(출력값, output)의 차이로 정의