inflearn logo
강의

Khóa học

Chia sẻ kiến thức

[Từ khái niệm đến thực tiễn] Giới thiệu hệ thống khuyến nghị

[Triển khai Python] Áp dụng mô hình Lasso

쿼리질문합니다!

241

mulju

27 câu hỏi đã được viết

0

user_profile_list = []

for userId in train['userId'].unique():
user = train[train['userId']==userId]
X_train = user[genres.columns]
y_train = user['rating']

reg = Lasso(alpha=0.03)
reg.fit(X_train, y_train)
user_profile_list.append([reg.intercept_, *reg.coef_])
 
이 부분을 배우고 있는데
다음 반복문에서 user[genres.columns], user['rating']
처럼 userId행을 가지고 다니지 않고 있는데
나중에
 
user_profile_lasso =
pd.DataFrame(user_profile_list,
index=train['userId'].unique(),
columns = ['intercept',*genres.columns])
 
 
쿼리를 작성할 때 index에 train['userId']를 갑자기 껴넣는다고
user_profile_list와 맞물려 작동하나요?
 

머신러닝 배워볼래요? pandas 추천-시스템 seaborn scikit-learn

Câu trả lời 1

0

sunmiyoon

pandas 에서 제공하는 unique() 메소드는 데이터 안의 중복을 없애주는데요. 데이터의 출연 순서대로 numpy.ndarray 를 리턴해줍니다.

https://pandas.pydata.org/docs/reference/api/pandas.unique.html

 

위에 반복문에서 train['userId'].unique()  계산해준 순서대로 user_profile_list 가 만들어졌기 때문에, train['userId'].unique() 를 인덱스로 하는 데이터 프레임을 만들어줄 수 있게 됩니다 :)

강의자료 requirements.txt 파일 위치?

0

403

2

추천시스템 심화 강의는 언제 올라오나요?

0

396

1

list of list 사용 이유

0

278

1

Lasso 하이퍼 파라미터 튜닝 강의 부분에서 질문드립니다.

0

398

1

현업에서 어떠한 방식으로 진행하는지 궁금합니다

1

270

1

train / test 구분하여 생기는 문제에 대해서

1

270

1

list(zip 사용하는 부분에서 질문드립니다.

1

258

1

predict 만드는 부분에서 질문합니다.

1

200

1

1분 질문

0

273

1

4:37 부분 질문입니다

1

250

1

1:50에 나오는 주석?처리 단축키가 뭔가요?

1

214

1

[강사님] Content_based가 이게 맞나요?

1

217

1

user_profile_list 및 리니어/라쏘 모델 설치 질문

0

251

1

실제 서비스에서 추천시스템을 사용하려면 매번 db의 모든 유저정보를 csv파일로 가져와서 알고리즘을 사용해야하나요?

0

253

1

regex 추출 한줄로

2

297

1

requirements.txt

1

193

1

predict 를 직접 구하는 방법에 대한 질문

1

445

1

Google Colaboratory 설치

1

226

2

오버피팅 방지 방법 관련 참고할 수 있는 코드가 있을까요?

1

343

2

sunplot

5

219

1

숙제3, 숙제4 결과 분석에 대한 질문입니다.

2

255

2

보충자료 링크 확인 부탁드립니다.

1

208

2

다음강의 시간

0

198

1

다른 확장자를 가지는 파일에 대한 분석

1

240

1