LSTM관련하여 질문드릴 수 있을까요....?
3662
3 asked
Keras를 활용하여 LSTM 학습을 하는중
입력값을 판단하기 어려운 부분이 있어 질문드립니다.
model = Sequential()
model.add(LSTM(128, batch_input_shape=(1, 4, 1), stateful=True))
model.add(Dense(12, activation='softmax'))
이처럼 구현할때 LSTM(128 부분의 128과, Dense(12 의 12가 무슨 의미인지 알 수 있을까요?
Answer 1
0
안녕하세요?
Keras Multi Layer Model에 대해서는 'Neural Network 개념과 MNIST예제' 단원에서 공부하셨을 거라 생각됩니다.
먼저 Dense Layer를 추가하는 model.add(Dense(12, activation='softmax'))의 경우는 12를 쓰는 이유가 명확합니다.
activation='softmax'와 같이 Activation함수를 softmax를 사용하는 것은 Multinomial Classification을 사용하는 것입니다.
정확히 어떤 예제인지는 모르겠지만 결과값이 12가지 종류 중 하나를 찾아주는 것 같네요.
가령 MNIST 손글씨 인식의 경우는 model.add(Dense(10, activation='softmax'))으로 0부터 9까지 총 10가지 종류를 지정하게 되고 보통 이 Layer는 결과를 나타내므로 마지막에 추가됩니다.
model.add(LSTM(128,~의 경우는 128이 Layer에 포함되는 units의 갯수라는 점은 같으나 절대적인 숫자를 의미하지는 않습니다.
즉 경험치에 의해서 LSTM(Long Short-Term Memory layer)에 128개의 units(dimensionality of the output space)을 줬을때 가장 좋은 결과를 가져오므로 이렇게 쓴 것이고 이 값은 모델을 튜닝하면서 변경하여 사용할 수 있습니다.
요즘은 최적의 값을 찾아주거나 CNN을 GUI 클라우드에서 쉽게 구해주는 teachable Machine과 같은 서비스가 나와있지만
전통적으로 Keras Multi Layer Model을 만들때는 여러 번의 경험치 값을 사용하며 최적의 모델을 만들게 됩니다.
감사합니다.
6-6
0
4
0
작업형 1 유형 부분
0
9
1
수강평 이벤트
0
16
2
작업형 1 (삭제예정, 구 버전)
0
28
2
강의노트는 어디있나요?
0
17
1
노션 학습 자료 권한 요청
0
16
1
수강기간 연장 문의드립니다.
0
21
1
2유형 레이블 인코딩 VS 원핫 인코딩
0
22
3
part2강의 문의사항입니다.
0
19
2
수강기간 연장 문의드립니다.
0
26
1
인덱스 슬라이싱
0
27
2
코드를 첨부해야하는 이유가 있나요?
0
20
2
지원오류
0
197
0
강의자료가 어디있나요?
0
258
0
RNN&BERT 코드 에러 질문입니다!
0
402
4
네이버 영화평 dataset 을 tfds.load 로 올린후 encoder method 까지 사용하려면?
0
434
2
코드를 그대로 돌렸는데 애로가 나오는 이유가 알고 싶습니다
0
601
1
accuracy가 훨씬 낮게 나오는 이유는 무엇인가요??
0
291
1
예제로 쓰인 코드가 어디있는지 모르겠습니다...
0
227
1
ImportError : DLL load failed
0
551
2
deprecated 가 의심되는 코드 하나 더 여쭙겠습니다
0
338
1
IMDB data 소스 코드 에러 사항
0
412
2
자료와 예제코드
0
364
1
다음을 실행하면 에러가 납니다.
0
1126
1

