강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của hahahahaha
hahahahaha

câu hỏi đã được viết

[Bản sửa đổi] Hướng dẫn hoàn hảo về máy học Python

Thực hành triển khai lọc dựa trên nội dung sử dụng bộ dữ liệu TMDB5000 - 02

컨텐츠 기반 필터링

Viết

·

274

0

안녕하세요.

 

컨텐츠 기반 필터링을 보면 서버에서 올려 구현하다고하면 메모리에 해당 정보들을 메모리에 올려서 해야되는건가요??

서버에서 사용한다면 새벽 n시에 메모리에 있는 업데이트를 한다던가(cron job처럼) 하는 작업이 있는걸까요??

아니면 이런 정보를 위한 DB가 따로 있나요??

 

감사합니다.

통계python머신러닝 배워볼래요?

Câu trả lời 3

0

HAHA님의 프로필 이미지
HAHA
Người đặt câu hỏi

질문 답변주신 내용에서 

대용양 데이터일 경우 db에 index걸어서 서비스 하신다고 하셨는데,

답변에서 남겨주신 내용을 토대로 한다면 결국 다시 memory에서 계산하는게 아닌가요??

제가 잘못 이해했으면 죄송합니다ㅠㅠ

 

0

HAHA님의 프로필 이미지
HAHA
Người đặt câu hỏi

혹시 DB에 예를 들어 어떤 포맷으로 올리는지 알려주실 수 있을까요?

사용자-아이템을 한다고 하면 모든 사용자와 모든 아이템을 계산해서 

record 수는 사용자 수

column 수는 아이템 수로 해서 db에 저장하는걸까요??

dooleyz3525님의 프로필 이미지
dooleyz3525
Người chia sẻ kiến thức

RDBMS 에 저장할 때는 코사인 유사도와 같은 데이터 포맷을 하기에는 컬럼수가 너무 많아서 안됩니다.  그래서 모두 ROW 형태로 내립니다. 그러니까 레코드수 사용자수 , 컬럼수 아이템수가 아니라 레코드 수 사용자수 X 아이템수, 컬럼수 2개(사용자아이디, 아이템 아이디)

 

HAHA님의 프로필 이미지
HAHA
Người đặt câu hỏi

넵 답변해주신 내용토대로 좀 더 고민해보고 이해가 안가는 점 있으면 다시 질문 남기겠습니다!
항상 질문 답변해주셔서 감사합니다!

0

dooleyz3525님의 프로필 이미지
dooleyz3525
Người chia sẻ kiến thức

안녕하십니까, 

네, 빠르게 서비스해야 하므로 메모리에 올려서 하는 경우가 많습니다. 하지만 대용량의 데이터 일 경우에는 db에서 index을 잘 걸어서 서비스를 하기도 합니다. 

보통은 db에 있는 정보를 새벽에 배치로 잘 가공해서 메모리에 올려 놓고 서비스 합니다. 

감사합니다. 

Hình ảnh hồ sơ của hahahahaha
hahahahaha

câu hỏi đã được viết

Đặt câu hỏi