inflearn logo
강의

Khóa học

Chia sẻ kiến thức

Học tăng cường cho lập trình viên (tác giả trực tiếp giảng dạy)

Lập trình thuật toán REINFORCE

MyModel(tf.keras.Model)에 action matrix와 reward와 관련해서

314

bs Jeon

12 câu hỏi đã được viết

0

training시에 필요한 action matrix와 reward를 받기위해 inputs에 dummy로 input_action_matrixs와 input_rewards를 정의하고 있는것처럼 보이는데요.

 

이렇게 하지않고 MyModel에 예를들면 setActionMatrixs, setRewards 이런식으로 함수를 정의하고 fit를 호출하기전에 set함수를 호출하여도 될것 같은데, 이렇게 했을때 단점이 있나요?

인공신경망 강화학습

Câu trả lời 1

0

multicoreit

안녕하세요 bs Jeon님

강의를 수강 해 주셔서 감사합니다.

말씀하신 것처럼

self.DUMMY_ACTION_MATRIX, self.DUMMY_REWARD = np.zeros((1,1,self.action_size)), 
                                              np.zeros((1,1,self.value_size))

위 코드는 변수 초기화를 위해서 사용하는 것입니다.

위와 같은 방식으로 사용하면 클래스가 생성되는 시점에 변수가 자동으로 초기화됩니다.

또한, bs Jeon님 의견과 같이 변수 초기화를 담당하는 set 함수를 정의해서 객체를 생성하는 시점에 set 함수를 호출해서 초기화할 수도 있습니다. 성능 상의 차이는 없고 단지 코드 구현 상의 차이입니다. 본인의 코딩 스타일에 맞게 사용하시면 됩니다.

감사합니다.

 

전 강의와 전혀 이어지지가 않음

0

23

1

pytorch local 설치 옵션에 conda 가 없습니다.

0

30

3

강화학습저장 및 로드

0

54

1

수업 하실 때 활용하시는 강의 자료를 제공 받을 수 있는지 문의 드립니다

0

66

2

마르코프 결정과정 질문

0

67

2

stable_baseline3 설치 안됨

0

249

2

최적화

0

32

0

소스코드

0

33

1

<대규모 언어 모델, 핵심만 빠르게!> 쿠폰은 언제쯤 발급되나요?

0

52

3

section 3 이후는 언제 보게 되나요?

0

75

2

강의확인 체크가 안됩니다

0

76

2

챌린지만 등록하고 강의 수강을 놓쳤습니다.

0

94

2

커리큘럼, 섹션 미스매치

1

69

1

전자책 정오 업데이트 관련 문의

0

57

2

쿠폰관련 문의

0

49

2

챌린지 강의 영상 업로드

0

50

2

쿠폰관련입니다ㅠ

0

69

2

section2는 언제 upload 하나요?

0

61

2

온라인 강의 관련 문의

0

67

3

실습강의 소스코드

0

73

2

환경구축에 대해서

0

79

2

2.7 TD 상태가치함수

1

270

1

cartpole_DQN 에러

0

413

2

PPO에서 min()을 사용하는 이유가 궁금합니다

0

594

1