강화학습에 보상과 처벌이라고 한다면...
137
23 asked
안녕하세요 재미있는 강의 잘보고있습니다. 강화학습에 보상과 처벌에 대해 질문이있습니다. 정의를 보상과 처벌이라고했지만 잘한 행동이면 예를들어 데이터를 1을주고 못하면 데이터를 0을주면서 컴퓨터가 잘한 행동인지 아닌지를 구별하게하는 용도일뿐인걸로 이해가되는데 맞는지 궁금합니다.
감사합니다.
Answer 0
10회 기출 작업형3 문제 2-1 질문
0
2
1
작업형 2 질문
0
6
1
작업형 2 템플릿 확인 요청
0
6
1
실습 2인데 커서아이디 같은거 다운로드 안내같은건 따로없나요??
0
4
1
5. 실습 (1) 개발 환경 준비와 프로젝트 구조 03:11
1
8
1
작업형2 인코딩 질문
0
19
2
작업형 3 벼락치기 공부방법 질문
0
24
2
14강의 예시 데이터를 통한 답을 구하는 과정에서의 문의
0
7
1
기출 11회 작업형 2_전체 데이터 학습 여부
0
29
2
예측값 결과 소수점 차이
0
25
2
여태까지 발견한 이슈들 공유드립니다.
1
30
1
기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?
0
30
1
전처리 train() test([ ])
0
20
2
작업형 1 배경지식 질문
0
27
2
Google Colaboratory 연결 시 접근 권한 거절 됩니다.
0
51
1
실습 중 에러발생 gt, pred = test()
0
136
1
11강 No module named 'torchmetrics' 에러
0
126
2
강의 재생이 안되요
0
126
1
1강 머신러닝 영문 표기 문의
0
386
1
강의자료 PDF파일과 실습자료 어디서 구하나요?
0
1016
2
커널 관련 질문 드립니다.
0
529
1
레이어 관련 질문 드립니다.
0
474
1
히든 레이어의 Node 수 관련 질문 드립니다.
0
736
1
노션 자료는 언제 오픈하나요?
0
433
1

