Q&A
선생님, 질문이 있습니다.
선생님, 우선 주말인데도 답변해주셔서 감사합니다. 이에 추가적으로 질문을 드리고 싶습니다. 일단 Flatten함수의 기능은 이해를 하였으니 괜찮습니다. shape가 (row,column)인 것도 잘 이해하였습니다. 1) 강의 10:32 ~ 10:54부분에서 사진 한 장을 세로로 쭉 표기를 하여 (784, )를 표현하셨는데 만일 batch_size가 32라고 가정했을 때 왜 갑자기 (32,784)로 바뀌는지 이해가 되지 않습니다. 그래서 선생님 답변을 토대로 손으로 제가 직접 신경망 그리면서 이해한 바는 다음과 같은데 맞는지 한번 봐주시면 감사합니다ㅜ.ㅜ boston에서 예를 들면 X배열 RN LSTAT feature3, ------- feature 784 record 1 3 3 record 2 2 3 ...... record 32 2 5 (32,2) 가 있으면 레코드의 개수(batch_size)가 32개이고 feature의 개수가 784개인데, 그러면 Input X 배열의 shape만 놓고 보았을 때 (32,784)가 되는 것이잖아요? (C based 수도 코드로 표기한다면 X[32][784]이렇게) 그런데 신경망에서 통과를 할 때에는 그 신경망 그림에서 x1,x2,x3 등등 이것들이 의미하는게 x1 : X[1][1] - X[32][1] x2 : X[1][2] - X[32][2] x3 : X[1][3] - X[32][3] ... x784 : X[1][784] - X[32][784] 제가 앞서서 어 그러면 Input X배열의 shape은 (32,784)이니까 summary()함수를 써보면 (None,784)가 나오는 게 이제서야 비로소 이해가 되는데, 저 (784, ) 라고 대체 왜 표기가 될까가 이해가 되지 않았습니다. 그런데 혹시 강의 10:54에서 저렇게 세로로 쭉 표기하신 input이 의미하는게, 그러니까 사진 한장(28x28)에 대한 (784, )의 단일 결과 수치가 아니라 input X배열을 세로 한 줄 씩 총 784개 의 feauture vector를 의미하는 것인가요? (여기서 말하는 feature vector란 boston에서 32개의 모든 레코드에서 RN을 세로로 쭉 합해놓은 열벡터를 의미합니다.) 2) 그 다음 W의 shape에 대한 질문입니다. 노드의 개수가 100인 어떤 Layer를 통과하는데요, 일단 여기서의 가중치 배열 W의 shape는 (100,784)이면 통상적으로 가중치 배열을 곱하고자 W.T해주는 것이죠? 그래서 W.T.shape가 (784,100)이 되는 것이구요 (Coursera강의에서도 Transpose를 나중에는 그냥 받아들이겠거니 해서 생략을 하고 (어제 제가 질문드릴 때 W가 W 자체인지 W.T인지 헷갈리게 글을 써둔 것 같아서 재확인 받고자 합니다.) 이게 맞다면, 원래 input 배열 X.shape는 (32,784)이고 1층의 가중치 배열 W의 W.T.shape는 (784,100)이 되니까 summary() 결과 (None,100)이 나오게 되는 것이군요! 이런 방식이면 다른 층에 대해서도 계속 똑같은 방식으로 일반화해서 이해를 해도 될까요????????? 감사합니다!
- いいね数
- 0
- コメント数
- 3
- 閲覧数
- 424

