inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 파이썬 머신러닝 완벽 가이드

사이킷런-타이타닉 예측 스케일링 질문드립니다.

288

윤다정

작성한 질문수 9

0

"사이킷런" 섹션 마지막 파트 타이타닉 실습에서 코드를 입력해보니 이렇게 알고리즘 별 정확도가 출력이 되긴 하지만, 밑에 빨간색으로 data를 스케일하라고 뜹니다.  (밑에 이미지 첨부) 이 실습이 그 전에 배웠던 '사이킷런' 학습 과정을 적용해보는 것인데 스케일링은 적용을 안해서 그런지 오류가 나는  것 같습니다. 

그래서 제가 그냥 

X_scaled = preprocessing.scale(X_train) 

를 추가하고, X_train들을 x_scaled라고 바꿔서 알고리즘을 다시 시행해 본 결과 빨간 오류 표시 없이 결과가 잘 나오는데,

대신 정확도가 급격하게 떨어졌습니다.

DecisionTreeClassifier 정확도: 0.3743
RandomForestClassifier 정확도:0.6592
LogisticRegression 정확도: 0.6592

라고 나오네요...

1. 이렇게 스케일링을 하는 것이 맞나요?

2. 정확도가 왜 떨어지나요?

python 통계 머신러닝 배워볼래요?

답변 1

0

권 철민

안녕하십니까,

해당 내용은 오류가 아니라 warning이라 수행에 큰 영향은 없습니다. 다만 사이킷런이 버전 upgrade되면서 LogiticRegression의 초기화 알고리즘이 변경이 되어서 warning이 발생했습니다. 해당 warning 을 무시하고 진행해도 문제 없으며 warning을 없애실려면 LogisticRegression(max_iter=150) 으로 수정해서 해보시지요. 그래도 warning이 나오면 max_iter를 더 증가해 주십시요.

감사합니다.

안녕하세요 열심히 수강중인 학생입니다

0

61

2

정수 인덱싱

0

68

2

넘파이 오류

0

85

2

11강 numpy의 axis 축 질문 드립니다.

0

85

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

79

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

70

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

75

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

64

2

5강 강의 오류가 있어요.

0

84

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

72

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

69

3

파이썬 다운그레이 후 사이킷런 재설치

0

117

2

좋은 강의 감사합니다.

0

72

2

scoring 함수 음수값

0

67

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

100

2

분류 평가 정확도 예측

0

76

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

98

1

카카오톡 채널 있나요

0

107

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

189

2

pca 스케일링 관련하여 질문드립니다.

0

100

2

주피터 대신 구글 코랩

0

172

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

147

2

실루엣 스코어..

0

85

2

float64 null 값 처리 방법

0

102

2