inflearn logo
강의

Course

Instructor

Complete mastery of deep learning theory + PyTorch practice

[Lab] Building a Fully Connected NN

9-2 fully connected NN

Resolved

132

HELLO

13 asked

1

여기서 네트워크를 구성할 때 맨 마지막에 sigmoid를 태운 후에 마지막에 또 Softmax를 태우는데, 이렇게 할 거면 애초부터 네트워크의 마지막단을 sigmoid가 아닌 softmax를 태우면 되는 거 아닌가요?

왜 sigmoid를 거친 후에 softmax를 태워야 하는 것인지 알 수 있을까요?

딥러닝 pytorch NLP 컴퓨터-비전 cnn rnn transformer llm

Answer 1

1

peterbyun969574

안녕하세요!

좋은 질문 감사합니다!

네 Sigmoid을 통과한 logit은 각각 0~1 사이의 값을 가지지만 logit 값들의 합은 1이 되지 않습니다!

따라서 예측 확률값으로 변환하기 위해서 Softmax 함수를 사용했습니다!

노션URL 이동문제

0

63

1

섹션12 실습코드 의 initialization 각각 적용 코드 문의

0

103

0

오타

0

88

0

혹시 이론강의 자료도 공유가 가능하실까요?

1

174

1

[sec. 2-8 실습] 배치사이즈의 선택

0

187

2

[section 14 / [실습] 직접 만든 CNN 모델과 ResNet, VGGNet을 활용한 CV 프로젝트] transforms.Normalize 질문

1

233

1

[section 14 / VGGNet ] receptive filed 질문

1

135

2

[섹션3, PyTorch로 구현해보는 Loss Function] 분류task loss함수 질문입니다.

1

242

2

KL Div Loss에서 Negative Entropy를 더해주는 의미에 대해서

1

197

2

GoogleNet Inception 모듈

1

170

2

Batch Normalization 효과

1

191

2

Layer Norm이 언어모델에 적합한 이유

1

553

1

Mini-batch Gradient Descent computation time 질문

1

178

2

Huber Loss에 대한 질문

1

314

2

Batch size 가 극단적으로 작은 경우 (예를들어 batch_size =1) Normalization 적용 방안

3

364

1

Normalization 질문

1

273

2

Section 7 [Activation Function의 종류] Softmax logit 분포와 Entropy 질문이 있습니다

2

212

1

Section 3 [실습] PyTorch로 구현해보는 Loss Function의 Cross Entropy 구현 관련하여 질문이 있습니다.

1

302

1

Section 3의 [이론] Regression task의 Loss: L1, L2, Huber, Log Cosh Loss "미분가능"관련 에서 질문이 있습니다.

1

288

1

Section 15 실습 중, lstm 클래스의 forward 함수 질문

1

245

2

Section 16 [이론] Transformer의 Encoder 질문

1

179

1

Auto Differentiation에서 computational Graph 질문있습니다

1

214

1

Section 3 이론 classification Loss function 질문

1

241

1

section4의 entropy 시그마 식 전개에 대한 질문입니다.

1

269

2