강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

한규천님의 프로필 이미지
한규천

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

TMDB5000 데이터 세트를 이용한 콘텐츠기반 필터링 구현 실습 - 02

유사도 매트릭스 도출

작성

·

220

0

유사도 매트릭스 도출에서 궁금증이 생겨서 질문합니다!

유사도 매트릭스를 도출할 때에 장르를 기반으로 도출하였는데, 혹시 2개 이상의 feature를 가지고 유사도를 도출할 수도 있나요?? 

예를 들면, genre와 keyword를 모두 사용한다면, 두 feature를 따로 CounterVecotrize 한 이후에 merge하면 되는 건가요??

답변 2

0

한규천님의 프로필 이미지
한규천
질문자

답변 감사합니다!! 참고하겠습니다

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

방법은 말씀하신 사항을 포함해서 아래와 같은 방법을 적용할 수 있을 것 같습니다.

1. 말씀하신 대로 두 feature를 따로 feature vectorization 한 후에 merge하여 코사인 유사도 등으로 유사도 도출

2. 두 feature를 모두 합쳐서 하나의 Text로 만든 다음에 feature vectorization 적용 후 유사도 도출

3. 두 feature를 각각 feature vectorization하고 코사인 유사도를 별도로 도출한 후 genre 유사도 * 특정 가중치 + keyword 유사도에 다른 특정 가중치를 부여하여 전체 유사도 재 계산(genre 특정 가중치 + keyword 특정 가중치 = 1)

감사합니다.

한규천님의 프로필 이미지
한규천

작성한 질문수

질문하기