Bước đầu làm quen với trí tuệ nhân tạo không cần toán: Từ cơ bản đến xu hướng mới nhất
Bài học 2. Phân loại chính của AI - 'mô hình phán đoán' xác định dữ liệu là gì.
강화학습에 보상과 처벌이라고 한다면...
Viết
·
111
0
안녕하세요 재미있는 강의 잘보고있습니다. 강화학습에 보상과 처벌에 대해 질문이있습니다. 정의를 보상과 처벌이라고했지만 잘한 행동이면 예를들어 데이터를 1을주고 못하면 데이터를 0을주면서 컴퓨터가 잘한 행동인지 아닌지를 구별하게하는 용도일뿐인걸로 이해가되는데 맞는지 궁금합니다.