inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

TensorFlow 2.0으로 배우는 딥러닝 입문

TensorFlow 2.0을 이용한 MNIST 숫자분류를 위한 CNN 구현

CNN 모델 관련 질문 드립니다.

해결된 질문

236

김상현

작성한 질문수 62

0

안녕하세요. 강의를 듣다가 궁금한게 생겨서 질문 남깁니다.

아래 CNN 모델 파라미터 설정 부분에서 

tf.keras.layers.Conv2D(filters=32, kernel_size=5, strides=1, padding='same', activation='relu')

filters와 activation에서 의문이 듭니다.

첫 째, filters가 32로 설정되어 있는데, 이미지에 5x5 크기의 32개 필터를 적용한 것으로 이해가 됩니다. 즉, 1개의 이미지가 32개의 필터링된 이미지로 변환.

여기서 드는 의문점은 필터의 종류만해도 수십가지가 될텐데, 이거는 CNN 모델이 알아서 적용을 하는 것인가요?

만약 그렇다고하면 원리가 무엇인지 알 수 있을까요?

CNN을 제가 이해하기로는 이미지에서 특정 부분을 추출하여 NN 입력으로 사용하는 것 같은데, 여기서 학습하면서 바뀌는 건 NN의 파라미터라 생각이 되거든요.  그러니까 필터는 학습하는 과정에서 바뀔 것이라 생각이 안되는데 어떻게 CNN 모델이 알맞은 필터를 적용할 수 있는지가 궁금합니다.

둘 째, activation이 설정되어 있는데, 필터링한 이미지에 왜 activation을 적용해야하는지 의문이 듭니다. 

제가 머신러닝에 대한 기초도없고 딥러닝에 대한 기초가 없어 질문이 너무 난해할 수 있을 것 같네요. 그래도 답변 부탁 드립니다. 감사합니다.

tensorflow 머신러닝 배워볼래요? 딥러닝

답변 1

0

AISchool

안녕하세요~. 반갑습니다.

여기서 드는 의문점은 필터의 종류만해도 수십가지가 될텐데, 이거는 CNN 모델이 알아서 적용을 하는 것인가요?

만약 그렇다고하면 원리가 무엇인지 알 수 있을까요?

-> 

CNN 모델이 알아서 적용하는 것이 맞습니다. 원리는 Loss Function을 최소화하는 값으로 파라미터를 갱신하는 것입니다. 즉, 정답과 오차가 가장 작은 파라미터(=Loss Function이 최소화되는)를 만들려면 어떻게 파라미터를 변경해야하는지를 자동으로 찾아가는 과정입니다.

둘 째, activation이 설정되어 있는데, 필터링한 이미지에 왜 activation을 적용해야하는지 의문이 듭니다. 

->

Activation은 딥러닝 모델이 Non-Linear한 패턴을 학습하고, 중요한 정보를 강조하고 불필요한 정보를 제거하기 위해서 딥러닝에서 구조적으로 취하는 패턴입니다. 좀더 자세한 내용은 아래 링크를 참조하세요.

https://www.analyticsvidhya.com/blog/2020/01/fundamentals-deep-learning-activation-functions-when-to-use-them/

감사합니다~.

22강 코드 call()메서드 is_training -> model(x,False)로 호출시 밸류에러 참고

0

67

1

선형 회귀 모델에 대해서 질문 있습니다

0

264

2

tf.keras.model.reset_states()

0

758

2

[질문]colab환경에서 텐서보드(TensorBoard)를 이용해서 학습과정 시각화(Visualization)하기강의 관련 질문

0

516

2

[질문]colab환경에서 tf.train.CheckpointManager API를 이용해서 파라미터 저장하고 불러오기 실행에 대한 질문

0

300

2

colab에서 구동 가능한 char-rnn 코드 관련 질문

0

225

1

안녕하세요 파이썬이랑 tensorflow 정확한 버전 알수있을까요?

0

260

1

colab 환경에서 Autoencoder 구현하였으나 결과가 보이지 않는 분들 참고사항

0

216

1

Mnist 에 keras를 통해 softmax를 활용한 regerssion error 발생

0

2112

2

GRU 리셋게이트, 포겟게이트 질문

0

268

1

ANN 구현

0

357

1

char-rnn 코랩 에러 ... 못보나요,, cpus는 너무 느려서

0

599

1

ANN으로 Mnist 숫자분류기 코드질문

0

299

1

ppt 12p 질문

0

388

1

keras에서 이미 정의된 모델을 가져와 학습할 경우

0

659

1

모델 코드 질문

0

376

1

코드 질문

0

287

1

ppt 10p

0

393

1

ppt 13p 추가 질문

0

265

1

ppt 9p 추가 질문

0

271

1

ppt 5p 질문

0

326

1

ppt 9p 질문

0

287

1

vanishing gradient

0

285

1

TensorFlow 2.0을 이용한 CIFAR-10 이미지 분류를 위한 CNN 구현 질문

0

266

1