inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

(UPDATED) Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능

추천 시스템의 정확도 측정

best-seller 정확도 측정

해결된 질문

257

kim aiden

작성한 질문수 1

3

'추천시스템의 정확도 측정'

best-seller방식으로 구한 예측값의 RMSE를 계산하는 부분에 질문이 있습니다.

 

y_pred = movie_mean[ratings.loc[user]['movie_id']]

 

이렇게 하면, User가 본 영화의 전체 평점이 예측값으로 나오는데요.

'특정 영화의 User의 평점 - 전체 평점평균' 에 대한 RMSE를 구하는 것이여서 Best-Seller  방식과는 관계없는 것 아닌가요?

 

알고리즘이 어떤 영화에대한 평균이 어떤 의미인지 잘 이해가 안되요.

 

Best-seller방식이라면 상위 한 개를 뽑는거여서 

추천방식이 'Star Kid' 영화만 y_pred로 들어가야하지 않나요?

딥러닝 추천-시스템

답변 1

1

거친코딩

안녕하세요.

거친코딩입니다.

학습자님께서 질문해주신 Best-seller 방식의 RMSE 산정에 대해서 말씀드리겠습니다.

먼저 Best-seller 알고리즘을 살펴보면,

def recom_movie(n_items):
    # ratings에 있는 평가 데이터를 pandas DataFrame의 groupby() 메소드를 활용해서 각 영화에 대한 평균을 구함
    movie_mean = ratings.groupby(['movie_id'])['rating'].mean()
    # 각 영화의 평점평균을 내림차순하고, 지정한 개수만큼 뽑아낸다.
    movie_sort = movie_mean.sort_values(ascending=False)[:n_items]
    # 뽑힌 movie_sort의 index를 기준으로 movie DataFrame에서 조회한다.
    recom_movies = movies.loc[movie_sort.index]
    # 선정된 영화의 제목을 골라내서 반환한다.
    recommendations = recom_movies['title']
    return recommendations

ratings(평점)을 group by (mean) 후, 내림차순을 하고 지정한 개수만큼 뽑아내는 방식입니다.

 

그럼 다시 돌아와서, 해당 알고리즘을 평가하려면 다음의 질문에 답을 해야합니다.

"실제로 각 영화를 기준으로 전체 사람들의 평점으로 group by(mean)한 결과가 신뢰가 있는지? "

해당 질문은 각 유저의 실제 영화 평점값을 대상으로 일일이 RMSE를 구하여서 평균을 내어 모델의 신뢰도를 확인하겠다는 의미입니다.

그래서 학습자님께서 마지막으로 질문해주신 

'Star Kid' 영화만 y_pred로 들어가야하지 않나요? 질문에 답을 드리면

start kid는 Best-Seller 방식의 최고 산출물이고,

모델 평가를 위해서는 1위만 평가하는것이 아니라, 

나머지 2~꼴찌 까지 정확하게 점수를 잘 예측했냐도 봐야합니다.

""" 만약 1등만 100점이고, 나머지 2~꼴찌는 빵점이라면 좋은 추천 알고리즘이라고 보기 힘들지 않을까요?"""

학습자님의 질문에 답이 되셨으면 좋겠고, 추가적인 질문이 있으시다면 편하게 남겨주세요.

감사합니다.

-거친코딩 드림-

 

 

 

model.predict 의 결과 값 index가 왜 movie id ?

0

410

3

model.predict에 특정 user id로 상위 movie 5개 출력?

0

380

3

새로운 회원이 선택한 영화를 모델로 넘기는 방법 질문

0

300

1

올려주신 파일과 sparse matrix

0

340

1

Unable to allocate 55.9 GiB for an array with shape (25000, 100000, 3) and data type int64

0

999

3

사용자 집단별 추천 코드

0

252

1

무비렌즈 최신 데이터를 이용하고싶은데요~

1

329

2

추천시스템의 이진데이터 적용

1

339

1

평가 관련

1

271

1

딥러닝 추천시스템 변수추가 부분 코드 관련 질문입니다.

1

3534

1

딥러닝을 위한 추천시스템 원핫 인코딩 질문

0

288

1

CF_knn_bias 실습에서 not in index error 발생합니다.

0

712

3

MergeError가 납니다

0

561

2

sparse matrix를 추천 알고리즘에 적용하기에서

0

287

1

코드 오류 질문입니다!

1

608

3

코드를 똑같이 따라햇을때

1

372

1

강의자료는 어디서 다운로드 받을 수 있나요?

0

318

1

train,test 분리 MF알고리즘에서 결과가 출력이 안되요 ㅠㅠ

1

393

1

알고리즘을 프로젝트에서 써보고 싶은데요

1

201

1

ML 방식 모델 활용방안에 대해서

1

250

1

그 외의 CF 정확도 개선방법에서

1

184

1

화면이 안나오는데 정상인가요?

1

213

1

아이템 기반 CF 코드 질문

1

302

3

실시간 처리 질문

1

204

1