컨텐츠 기반 필터링
298
52 asked
안녕하세요.
컨텐츠 기반 필터링을 보면 서버에서 올려 구현하다고하면 메모리에 해당 정보들을 메모리에 올려서 해야되는건가요??
서버에서 사용한다면 새벽 n시에 메모리에 있는 업데이트를 한다던가(cron job처럼) 하는 작업이 있는걸까요??
아니면 이런 정보를 위한 DB가 따로 있나요??
감사합니다.
Answer 3
0
질문 답변주신 내용에서
대용양 데이터일 경우 db에 index걸어서 서비스 하신다고 하셨는데,
답변에서 남겨주신 내용을 토대로 한다면 결국 다시 memory에서 계산하는게 아닌가요??
제가 잘못 이해했으면 죄송합니다ㅠㅠ
0
혹시 DB에 예를 들어 어떤 포맷으로 올리는지 알려주실 수 있을까요?
사용자-아이템을 한다고 하면 모든 사용자와 모든 아이템을 계산해서
record 수는 사용자 수
column 수는 아이템 수로 해서 db에 저장하는걸까요??
0
RDBMS 에 저장할 때는 코사인 유사도와 같은 데이터 포맷을 하기에는 컬럼수가 너무 많아서 안됩니다. 그래서 모두 ROW 형태로 내립니다. 그러니까 레코드수 사용자수 , 컬럼수 아이템수가 아니라 레코드 수 사용자수 X 아이템수, 컬럼수 2개(사용자아이디, 아이템 아이디)
0
안녕하십니까,
네, 빠르게 서비스해야 하므로 메모리에 올려서 하는 경우가 많습니다. 하지만 대용량의 데이터 일 경우에는 db에서 index을 잘 걸어서 서비스를 하기도 합니다.
보통은 db에 있는 정보를 새벽에 배치로 잘 가공해서 메모리에 올려 놓고 서비스 합니다.
감사합니다.
안녕하세요 열심히 수강중인 학생입니다
0
58
2
정수 인덱싱
0
66
2
넘파이 오류
0
83
2
11강 numpy의 axis 축 질문 드립니다.
0
84
2
Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.
0
76
2
Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.
0
68
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
73
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
62
2
5강 강의 오류가 있어요.
0
81
1
실무에서 LTV 관련 모델 선택 질문입니다!
0
71
2
14강 강의 듣는중에 궁금한게 있어서 질문합니다~
0
67
3
파이썬 다운그레이 후 사이킷런 재설치
0
115
2
좋은 강의 감사합니다.
0
70
2
scoring 함수 음수값
0
66
2
6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?
0
98
2
분류 평가 정확도 예측
0
75
2
안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.
0
96
1
카카오톡 채널 있나요
0
104
1
혹시 강의에서 사용하시는 ppt 받을 수 있는건가요
0
187
2
pca 스케일링 관련하여 질문드립니다.
0
100
2
주피터 대신 구글 코랩
0
169
2
강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?
0
145
2
실루엣 스코어..
0
82
2
float64 null 값 처리 방법
0
99
2

