강의

멘토링

커뮤니티

Inflearn Community Q&A

rbcjswkd0340's profile image
rbcjswkd0340

asked

[Revised Edition] The Complete Guide to Python Machine Learning

Content-based filtering implementation practice using TMDB5000 data set - 02

유사도 매트릭스 도출

Written on

·

230

0

유사도 매트릭스 도출에서 궁금증이 생겨서 질문합니다!

유사도 매트릭스를 도출할 때에 장르를 기반으로 도출하였는데, 혹시 2개 이상의 feature를 가지고 유사도를 도출할 수도 있나요?? 

예를 들면, genre와 keyword를 모두 사용한다면, 두 feature를 따로 CounterVecotrize 한 이후에 merge하면 되는 건가요??

통계python머신러닝 배워볼래요?

Answer 2

0

rbcjswkd0340님의 프로필 이미지
rbcjswkd0340
Questioner

답변 감사합니다!! 참고하겠습니다

0

dooleyz3525님의 프로필 이미지
dooleyz3525
Instructor

안녕하십니까,

방법은 말씀하신 사항을 포함해서 아래와 같은 방법을 적용할 수 있을 것 같습니다.

1. 말씀하신 대로 두 feature를 따로 feature vectorization 한 후에 merge하여 코사인 유사도 등으로 유사도 도출

2. 두 feature를 모두 합쳐서 하나의 Text로 만든 다음에 feature vectorization 적용 후 유사도 도출

3. 두 feature를 각각 feature vectorization하고 코사인 유사도를 별도로 도출한 후 genre 유사도 * 특정 가중치 + keyword 유사도에 다른 특정 가중치를 부여하여 전체 유사도 재 계산(genre 특정 가중치 + keyword 특정 가중치 = 1)

감사합니다.

rbcjswkd0340's profile image
rbcjswkd0340

asked

Ask a question