강화학습에 보상과 처벌이라고 한다면...
135
ref63184917
23 asked
0
안녕하세요 재미있는 강의 잘보고있습니다. 강화학습에 보상과 처벌에 대해 질문이있습니다. 정의를 보상과 처벌이라고했지만 잘한 행동이면 예를들어 데이터를 1을주고 못하면 데이터를 0을주면서 컴퓨터가 잘한 행동인지 아닌지를 구별하게하는 용도일뿐인걸로 이해가되는데 맞는지 궁금합니다.
감사합니다.
머신러닝
딥러닝
Answer 0
예시문제 작업형2 (ver2023) 질문입니다
0
6
1
Data type에 따른 처리
0
4
1
Cursor 실행 문의
1
10
2
데이터 전처리 관련
0
9
2
시험에서 문제 불러오기
0
7
2
2번문제 출력값 질문
0
12
2
pd.get_dummies()가 bool로 반환
0
14
2
대응표본검정 레빈
0
17
3
단일표본검정 문제 유형
0
17
2
[작업형 3] 6~7. 카이제곱 검정
0
15
2
9회 작업형3 문제 1-1
0
28
2
최종답안 계산 방식 질문
0
17
1
시험 치기 전 급하게 질문 사항
0
29
2
유형3
0
28
2
Google Colaboratory 연결 시 접근 권한 거절 됩니다.
0
51
1
실습 중 에러발생 gt, pred = test()
0
135
1
11강 No module named 'torchmetrics' 에러
0
126
2
강의 재생이 안되요
0
124
1
1강 머신러닝 영문 표기 문의
0
386
1
강의자료 PDF파일과 실습자료 어디서 구하나요?
0
1016
2
커널 관련 질문 드립니다.
0
528
1
레이어 관련 질문 드립니다.
0
474
1
히든 레이어의 Node 수 관련 질문 드립니다.
0
736
1
노션 자료는 언제 오픈하나요?
0
433
1

