강화학습에 보상과 처벌이라고 한다면...
119
작성한 질문수 23
안녕하세요 재미있는 강의 잘보고있습니다. 강화학습에 보상과 처벌에 대해 질문이있습니다. 정의를 보상과 처벌이라고했지만 잘한 행동이면 예를들어 데이터를 1을주고 못하면 데이터를 0을주면서 컴퓨터가 잘한 행동인지 아닌지를 구별하게하는 용도일뿐인걸로 이해가되는데 맞는지 궁금합니다.
감사합니다.
답변 0
평가결과값 문의
0
3
1
시계열 데이터 날짜와 시간 format
0
15
1
평가지표 F1 스코어 질문드립니다.
0
17
2
파트9 강의는 언제 오픈하시나요
0
25
2
작업형 2 기출7회분에서
0
32
2
ZIP 파일
0
23
2
26강 13F 강의 불일치 및 질문 요청
0
29
3
[업로드오류] 강의 내용과 제목 불일치
0
24
2
작업형2 모의문제1 (30강)
0
28
2
수강 기간 연장 문의 드립니다.
0
35
2
섹션22 퀴즈 질문
0
30
1
수강 계획과 관련해 문의 드립니다.
0
26
2
Breadth (등락 비율) 분석
0
23
1
작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?
0
49
2
Google Colaboratory 연결 시 접근 권한 거절 됩니다.
0
40
1
실습 중 에러발생 gt, pred = test()
0
120
1
11강 No module named 'torchmetrics' 에러
0
115
2
강의 재생이 안되요
0
119
1
1강 머신러닝 영문 표기 문의
0
380
1
강의자료 PDF파일과 실습자료 어디서 구하나요?
0
997
2
커널 관련 질문 드립니다.
0
517
1
레이어 관련 질문 드립니다.
0
466
1
히든 레이어의 Node 수 관련 질문 드립니다.
0
731
1
노션 자료는 언제 오픈하나요?
0
420
1





