인프런 커뮤니티 질문&답변
유사도 매트릭스 도출
작성
·
220
0
유사도 매트릭스 도출에서 궁금증이 생겨서 질문합니다!
유사도 매트릭스를 도출할 때에 장르를 기반으로 도출하였는데, 혹시 2개 이상의 feature를 가지고 유사도를 도출할 수도 있나요??
예를 들면, genre와 keyword를 모두 사용한다면, 두 feature를 따로 CounterVecotrize 한 이후에 merge하면 되는 건가요??
답변 2
0
0
권 철민
지식공유자
안녕하십니까,
방법은 말씀하신 사항을 포함해서 아래와 같은 방법을 적용할 수 있을 것 같습니다.
1. 말씀하신 대로 두 feature를 따로 feature vectorization 한 후에 merge하여 코사인 유사도 등으로 유사도 도출
2. 두 feature를 모두 합쳐서 하나의 Text로 만든 다음에 feature vectorization 적용 후 유사도 도출
3. 두 feature를 각각 feature vectorization하고 코사인 유사도를 별도로 도출한 후 genre 유사도 * 특정 가중치 + keyword 유사도에 다른 특정 가중치를 부여하여 전체 유사도 재 계산(genre 특정 가중치 + keyword 특정 가중치 = 1)
감사합니다.





