강화학습에 보상과 처벌이라고 한다면...
138
작성한 질문수 23
안녕하세요 재미있는 강의 잘보고있습니다. 강화학습에 보상과 처벌에 대해 질문이있습니다. 정의를 보상과 처벌이라고했지만 잘한 행동이면 예를들어 데이터를 1을주고 못하면 데이터를 0을주면서 컴퓨터가 잘한 행동인지 아닌지를 구별하게하는 용도일뿐인걸로 이해가되는데 맞는지 궁금합니다.
감사합니다.
답변 0
출력값 질문
0
9
1
슬롯 관련 문의
1
10
2
수업노트가 어디에 있나요?
0
19
1
[긴급요청] 28강 동영상 전체에 오디오가 잘못들어가있습니다.
0
16
1
실제 계좌 잔고 및 테스트중에
1
29
4
설치 및 설정 가이드 노션 자료는 없나요 ?
0
22
2
실기시험 제출관련
0
152
2
6.20 작업형 2 과적합
0
157
3
코딩팡 장업형2 베이스 라인 인코딩 종류 질문
0
49
2
로지스틱회귀, 회귀
0
48
2
회귀 문제를 풀때 질문입니다.
0
55
1
불균형 처리 후 성능이 더 낮아졌다면,
0
61
2
실기 체험 제2유형 에러 문의
0
61
1
LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요
0
50
2
Google Colaboratory 연결 시 접근 권한 거절 됩니다.
0
52
1
실습 중 에러발생 gt, pred = test()
0
137
1
11강 No module named 'torchmetrics' 에러
0
127
2
강의 재생이 안되요
0
126
1
1강 머신러닝 영문 표기 문의
0
386
1
강의자료 PDF파일과 실습자료 어디서 구하나요?
0
1018
2
커널 관련 질문 드립니다.
0
532
1
레이어 관련 질문 드립니다.
0
474
1
히든 레이어의 Node 수 관련 질문 드립니다.
0
738
1
노션 자료는 언제 오픈하나요?
0
434
1





