49,500원
다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결[개념부터 실습까지] 추천 시스템 입문편
추천시스템 심화 강의는 언제 올라오나요?
안녕하세요.혹시 추천시스템 심화 강의는 언제 올라오는지 알 수 있을까요?
- 미해결[개념부터 실습까지] 추천 시스템 입문편
list of list 사용 이유
[영화 메타 데이터 분석] 장르 분석에서 list of list를 사용하여 flatten을 하는 법을 배웠는데, list of list를 사용한 이유가 무엇일까요?flatten을 사용하려면 list of list 상태여야 가능한 것 때문일까요?그냥 list 상태에서는 사용할 수 없는 것일까요?앞으로는 강의에서 함수의 사용 목적이나 이유까지 설명해 주시면 좋을 것 같습니다~
- 미해결[개념부터 실습까지] 추천 시스템 입문편
Lasso 하이퍼 파라미터 튜닝 강의 부분에서 질문드립니다.
Random Search로 최적의 alpha값 찾기 중 param_grid = {'alpha' : sp_rand()}rsearch = RandomizedSearchCV(estimator=model, param_distributions=param_grid, n_iter=200, cv=10, random_state=42)rsearch.fit(user1001[genre_cols], user1001['rating'])intercept = rsearch.best_estimator_.intercept_coef = rsearch.best_estimator_.coef_ 를 입력했을때 coef의 값은 0과 -0으로 차있고user1001_profile = pd.DataFrame([intercept, coef], index=['intercept', genre_cols], columns=['score']) 를 입력했을때 출력은 intercept값을 제외하고 다 0으로 값이 되어있습니다.시각화 했을때 당연히 막대 그래프도 값도 이상하구요.. my-ratings.csv에 있는 데이터들이 부족해서 그런걸까요? 나름 데이터는 10개 이상으로 채웠는데 어디서 문제인지 잘 모르겠습니다.
- 미해결[개념부터 실습까지] 추천 시스템 입문편
현업에서 어떠한 방식으로 진행하는지 궁금합니다
안녕하세요 강의 너무 잘 들었습니다!! 강의를 듣고 궁금한 점이 있습니다 궁금한 점은 현업에서도 이와 유사한 프로세스로 진행되나요? 그리고 선형 모델 말고 트리기반이라던가(xgb lgm cbm) 뉴럴넷을 사용했을 때 모든 사용자에 대해 각각의 모델을 따로 만들어서 진행 해야할 것 같은데 너무 오래걸리거나 그런 문제는 없나요?
- 미해결[개념부터 실습까지] 추천 시스템 입문편
train / test 구분하여 생기는 문제에 대해서
user_profile에 저장한 intercept와 coefficient 값들은 train 데이터셋을 통해서 얻었기때문에, test셋에 있는 user가 train set에는 없는 경우가 있을 수 있을 것 같은데 이렇게하면, user_profile.loc[user] 라는 코드는 존재하지 않는 index에 대한 참조가 되기에 Key Error가 발생할 것으로 보입니다. 이를 미리 확인해보고 싶은데, Key Error를 미리 확인하는 방법을 못찾겠네요... 이를 확인하는 코드와 처리하는 방법이 궁금해요 그리고
- 미해결[개념부터 실습까지] 추천 시스템 입문편
list(zip 사용하는 부분에서 질문드립니다.
no genres listed일때 3.20이 아니라 1.04..을 더한 값 4.2..가 되는게 아닌가요? +추가질문입니다 다른 데이터를 사용해서 강의를 듣고 있는데 coef 값이 너무 크거나 너무 작게 나올때가 있습니다. 이런 경우에는 입력된 데이터의 잘못일까요..?
- 미해결[개념부터 실습까지] 추천 시스템 입문편
predict 만드는 부분에서 질문합니다.
train 데이터로 만든 user_profile에서 test에 있는 유저가 없을 경우에 오류가 나는데 이런 경우는 어떻게 처리하나요??
- 미해결[개념부터 실습까지] 추천 시스템 입문편
쿼리질문합니다!
user_profile_list = [] for userId in train['userId'].unique(): user = train[train['userId']==userId] X_train = user[genres.columns] y_train = user['rating'] reg = Lasso(alpha=0.03) reg.fit(X_train, y_train) user_profile_list.append([reg.intercept_, *reg.coef_]) 이 부분을 배우고 있는데 다음 반복문에서 user[genres.columns], user['rating'] 처럼 userId행을 가지고 다니지 않고 있는데 나중에 user_profile_lasso = pd.DataFrame(user_profile_list, index=train['userId'].unique(), columns = ['intercept',*genres.columns]) 쿼리를 작성할 때 index에 train['userId']를 갑자기 껴넣는다고 user_profile_list와 맞물려 작동하나요?
- 미해결[개념부터 실습까지] 추천 시스템 입문편
1분 질문
그냥 컬럼을 선택할 수도 있는데 혹은 to_list 같은 방법을 쓰지 않고 왜 interrows를 사용하는 건가요? 특별한 이유를 모르겠습니다.
- 미해결[개념부터 실습까지] 추천 시스템 입문편
4:37 부분 질문입니다
말씀하신 것 처럼 한 장르에 대한 group by 가 아니라 genre_cols 리스트에 있는 모든 열을 가지고 하나하나 group by 하는 것인데 왜 for 문을 쓰지 않고 []에 리스트만 갖다붙여도 맞는 결과가 나오는 것인가요? 반대로 for 문을 써서 하면 값이 다르게 나오네요 어떤 이유 떄문인지 여쭤보고 싶습니다:)
- 미해결[개념부터 실습까지] 추천 시스템 입문편
1:50에 나오는 주석?처리 단축키가 뭔가요?
1:50 초에 나오는 주석처리 단축키가 어떻게 되나요?? Shift + Enter 로는 당연히 안되고, +텍스트로 해도 영상과 같은 처리가 안되는데 어떻게 해야하나요?
- 미해결[개념부터 실습까지] 추천 시스템 입문편
[강사님] Content_based가 이게 맞나요?
추천시스템 관련 리서치를 해보았는데, 여기서 안내해주시는 모델은 (현재 content-based recommendation1까지 들음) 사실상 Collaborative Filtering이 아닌가 싶네요? Content-based는 말그대로 글, 이미지 같은 정보들을 벡터화하고 유사도 측정해서 가장 비슷한 정보를 찾는 방식으로 이해하고 있는데... 혼란스러워서 답변 주시면 감사하겠습니다.
- 미해결[개념부터 실습까지] 추천 시스템 입문편
user_profile_list 및 리니어/라쏘 모델 설치 질문
여기서 Key error 가 뜨는데 왜그럴까요? -> 보니까 merge 할 때 genres 라는 필드명이 일치해서 _x 라는 suffix 가 붙는 것 같아요..저희가 핸들링할때 genres 필드를 없앴었나요? ㅠㅠ 여기서도 LinearRegression이나 Lasso 모델이..뭔가 설치가 제대로 안됐나 싶은데 ㅠㅠ 어떻게 해야할까요?
- 미해결[개념부터 실습까지] 추천 시스템 입문편
실제 서비스에서 추천시스템을 사용하려면 매번 db의 모든 유저정보를 csv파일로 가져와서 알고리즘을 사용해야하나요?
실제 서비스에서 추천시스템을 사용하려면 매번 db의 모든 유저정보를 csv파일로 가져와서 알고리즘을 사용해야하나요? 지속적으로 추천시스템을 업데이트 하고 싶다면요!
- 미해결[개념부터 실습까지] 추천 시스템 입문편
regex 추출 한줄로
소소하지만 편하게 한줄로 extract하는 방법 공유합니다. extract() 안에 '\((\d{4})\)'로 넣으면 패턴을 찾을땐 소괄호 포함한 4자리를 찾지만 값을 돌려줄땐 4자리만 돌려줍니다
- 미해결[개념부터 실습까지] 추천 시스템 입문편
requirements.txt
requirements.txt의 내용이 위처럼 나오는데 pandas 이전의 것들만 지우고 사용해도 되나요?
- 미해결[개념부터 실습까지] 추천 시스템 입문편
predict 를 직접 구하는 방법에 대한 질문
질문1) 질문1-1) reg.predict(x_test) 할 때 x_test의 각각의 genre_cols(독립변수)들을 reg가 어떻게 찾는지 궁금합니다. reg.coef_ 해보면 array로 나와서 그냥 순서로 보는건지 아닌지가 헷갈려서 그렇습니다. 질문1-2) 만약 reg의 각 coef_에 column(독립변수) 정보가 있어서 그걸로 매칭하는 거라면 그 정보는 어떻게 확인하고 어떻게 접근하는지 궁금합니다. 질문1-3) 만약 reg의 coef_순서와 x_test cols의 순서를 매칭해서 계산한다면 테스트셋과 reg의 독립변수의 순서가 항상 동일하다는 가정하에 진행하는 건지 그래서 항상 순서가 엉키지 않도록 구성해야하는 건지 궁금합니다. 질문2) 비슷한 질문인데요 predict = reg.predict(x_test) 의 return 으로 [array, shape (n_samples,)] predicted values. 가 온다는데 predict가 array 형식이라면 rmse 계산을 위해 mean_squeared_error(y_test, predict) 할 때 이것도 movie 순서로 비교하는 것인지 그렇다면 두 인자가 같은 영화에 대한 평점을 비교할 것이라고 어떻게 보장하는지 궁금합니다. (질문1과 다르게 같은 테스트 셋을 역할에 맞게 쪼갠 거(x_test, y_test)라서 순서가 어느정도 보장될 거 같기는 합니다.) 질문3) 사실 질문1, 2는 아래와 같이 reg.predict() 대신 직접 구하려다보니 생긴 질문이었는데요. 두 세트(reg.coef, x_test)를 컬럼의 순서로 매칭을 시키고 그 순서가 보장됐다는 가정 하에 아래와 같이 짜보았고 값도 predict 함수와 같은 값을 잘 구할 수 있었습니다. predict = [] for i in range(len(x_test)): result = reg.intercept_ for y in range(0, len(genres.columns)): result += x_test.iloc[i, y] * reg.coef_[y] predict.append(result) predict 질문3-1) 직접 짤 경우에 이렇게 짜는게 맞는지 궁금합니다. 맞다면 독립변수 순서가 다르면 안 돼서 안전하게 columns sorting을 하는게 좋겠죠? 질문3-2) 제가 위에를 직접 짜기 위해서 dataFrame for문 돌리는 거 하나하나 다 찾아봐서 제가 원하는 형식의 loop를 찾아서 하기는 했는데요. 직접 predict를 만들고 싶은 경우에 loc나 다른 for문이나 groupby나 사용해서 저것보다 더 간단하게 하는 방법이 있는지도 궁금합니다.
- 미해결[개념부터 실습까지] 추천 시스템 입문편
Google Colaboratory 설치
Google Colaboratory가 구글 드라이브 - 새로 만들기 - 더보기에도 없고, 연결할 앱 더보기에서 검색해도 나오지 않습니다. 어떻게 설치해야하나요?
- [개념부터 실습까지] 추천 시스템 입문편
숙제 - 영화 평점 기반 질문 드립니다.
삭제된 글입니다
- 미해결[개념부터 실습까지] 추천 시스템 입문편
오버피팅 방지 방법 관련 참고할 수 있는 코드가 있을까요?
안녕하세요, 좋은 강의 잘 듣고 있습니다 :) 섹션 7. Content-Based Recommendation 2 -> [파이썬 구현] 오버피팅 (Overfitting) 강의 마지막에 오버피팅을 방지하는 방법으로 '빈도수가 낮은 장르 없애기', 'correlation이 높은 장르들을 합치기', '데이터가 적은 user에 대한 평점을 전체 평균 / 유저별 평균 / contents-based filtering 1 강의에서 사용한 방법으로 예측'하는 것에 대한 코드 작성을 해볼 것을 말씀해주셨었는데, 혹시 참고할 수 있는 코드가 있을까요? 가능하다면, 제가 도출한 결과와 비교해보고 싶습니다! 감사합니다 :)