bias가 왜 필요한지 정확하게 모르겠습니다.
저는 인공지능 관련 학과에 재학중입니다. 저학년 때 공부를 덜 해서 기초가 부족함을 느끼고 호형님 강의로 기초 공부를 하고 있는데요, 교수님께서 강의하실 때도 항상 궁금했던 건데 은닉층 사이 weight값들이 있음에도 불구하고 bias가 왜 있는건지가 궁금합니다.
Answer 1
0
안녕하세요.
좋은 질문입니다.
bias 없이 레이어를 구성하면 h(x)=Wx의 형태가 되고 이는 인풋이 0이면 무조건 0을 출력을 하게 되죠. 따라서 h(x)=Wx+b 형태로 레이어를 구성하여 피쳐값을 조정할 수 있습니다. (즉, bias b를 통해 각 피쳐값을 평행이동 시킬 수 있습니다.) 더 나아가 ReLU같은 nonlinear activation function a을 통해 비선형 레이어 h(x)=a(Wx+b)를 만들어 신경망을 구축할 수 있습니다.
추가적으로, b도 W와 마찬가지로 학습가능한 모델 파라메터입니다!
감사합니다.
6-6
0
8
1
작업형 1 유형 부분
0
11
1
import torch가 안되는 경우는 어떻게 하나요?
0
16
1
작업형 1 (삭제예정, 구 버전)
0
31
2
강의노트는 어디있나요?
0
17
1
수강기간 연장 문의드립니다.
0
21
1
2유형 레이블 인코딩 VS 원핫 인코딩
0
24
3
수강기간 연장 문의드립니다.
0
26
1
인덱스 슬라이싱
0
27
2
소리가 겹쳐서 들려요
0
21
2
6-6 실습 문의
0
24
2
섹션5 노션링크 는 따로 없나요?
0
30
2
Part 4에서 강의 연관 노션 정보들이 워드파일에 없습니다.
0
33
2
첨부자료 Part 4 코드 확인 부탁드리겠습니다.
0
29
2
다중레이어 경사하강법에서 질문
0
264
2
XOR파트에서 입력표현 방식
1
286
2
경사하강법에서 다중레이어에서의 가중치를 구할 때 식이 이해가 가질 않습니다 ㅠ.ㅠ
1
366
1
경우에 따른 최적의 활성화 함수 선정하는 방법
0
431
2
전이학습 강의 중 질문이 있어서 남깁니다.
0
275
1
XOR 파트에서 질문 있습니다.
0
270
1
SGD + 모멘텀 등의 코드
0
479
1
LSTM 모형의 이해
1
616
1
RNN 가중치 w,u,l shape 질문
1
371
1
과적합 판단 방법에 대해 질문 드립니다.
0
2321
1

