• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

컨텐츠 기반 필터링

22.05.04 16:35 작성 조회수 134

0

안녕하세요.

 

컨텐츠 기반 필터링을 보면 서버에서 올려 구현하다고하면 메모리에 해당 정보들을 메모리에 올려서 해야되는건가요??

서버에서 사용한다면 새벽 n시에 메모리에 있는 업데이트를 한다던가(cron job처럼) 하는 작업이 있는걸까요??

아니면 이런 정보를 위한 DB가 따로 있나요??

 

감사합니다.

답변 3

·

답변을 작성해보세요.

0

HAHA님의 프로필

HAHA

질문자

2022.05.04

질문 답변주신 내용에서 

대용양 데이터일 경우 db에 index걸어서 서비스 하신다고 하셨는데,

답변에서 남겨주신 내용을 토대로 한다면 결국 다시 memory에서 계산하는게 아닌가요??

제가 잘못 이해했으면 죄송합니다ㅠㅠ

 

0

HAHA님의 프로필

HAHA

질문자

2022.05.04

혹시 DB에 예를 들어 어떤 포맷으로 올리는지 알려주실 수 있을까요?

사용자-아이템을 한다고 하면 모든 사용자와 모든 아이템을 계산해서 

record 수는 사용자 수

column 수는 아이템 수로 해서 db에 저장하는걸까요??

RDBMS 에 저장할 때는 코사인 유사도와 같은 데이터 포맷을 하기에는 컬럼수가 너무 많아서 안됩니다.  그래서 모두 ROW 형태로 내립니다. 그러니까 레코드수 사용자수 , 컬럼수 아이템수가 아니라 레코드 수 사용자수 X 아이템수, 컬럼수 2개(사용자아이디, 아이템 아이디)

 

HAHA님의 프로필

HAHA

질문자

2022.05.04

넵 답변해주신 내용토대로 좀 더 고민해보고 이해가 안가는 점 있으면 다시 질문 남기겠습니다!
항상 질문 답변해주셔서 감사합니다!

0

안녕하십니까, 

네, 빠르게 서비스해야 하므로 메모리에 올려서 하는 경우가 많습니다. 하지만 대용량의 데이터 일 경우에는 db에서 index을 잘 걸어서 서비스를 하기도 합니다. 

보통은 db에 있는 정보를 새벽에 배치로 잘 가공해서 메모리에 올려 놓고 서비스 합니다. 

감사합니다.