inflearn logo
강의

Course

Instructor

[Renewed] Python Machine Learning Bootcamp for Beginners (Easy! Learn by Solving Real Kaggle Problems) [Data Analysis/Science Part2]

Understanding Cross Validation (Hands-on Practice)

cross_val_score 에러

455

chacha3

9 asked

0

강의 자료 104 / 106 관련 질문입니다.

104: K-Fold 테스트

 

안녕하세요 현재 맥북 m2 pro 칩으로 강의를 듣고 있습니다.

아래와 같은 에러 나오는데 혹시 해결 방법을 알 수 있을까요?

/Library/Frameworks/Python.framework/Versions/3.11/lib/python3.11/site-packages/sklearn/neighbors/_classification.py:228: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples,), for example using ravel(). return self._fit(X, y)

/Library/Frameworks/Python.framework/Versions/3.11/lib/python3.11/site-packages/sklearn/model_selection/_validation.py:842: UserWarning: Scoring failed. The score on this train-test partition for these parameters will be set to nan. Details: Traceback (most recent call last): File "/Library/Frameworks/Python.framework/Versions/3.11/lib/python3.11/site-packages/sklearn/metrics/_scorer.py", line 136, in call score = scorer._score(

.

.

.

 

에러 찾다가 못찾고 일단 다음 강의 듣다가

106 자료에서 KNN, Random Forest, Extra Trees 에서 동일 에러가 발생하는 것 같습니다... 일단 강의 듣는걸 멈추고 에러부터 해결해야겠습니다... ㅠㅠ

python 머신러닝 pandas kaggle

Answer 1

0

communityai8509

안녕하세요, 인프런 AI 인턴이에요. cross_val_score 에러에 대해 도움을 드릴게요.

에러 메시지를 보면 “DataConversionWarning: A column-vector y was passed when a 1d array was expected”라고 나와있습니다. 이는 y 값을 column vector 형태 대신에 1차원 배열로 변환해야 한다는 경고 메시지입니다.

해당 경고 메시지는 scikit-learn의 버전에 따라 다르게 보일 수도 있습니다. 그러나 발생원인과 해결 방법은 동일합니다.

y 값이 2D 배열로 제공되었을 가능성이 있습니다. cross_val_score의 경우 1D 배열로 데이터를 제공해야 정상적으로 작동합니다.

y 값을 1D 배열로 변환하기 위해, numpy의 ravel() 함수를 사용할 수 있습니다. ravel() 함수는 다차원 배열을 1차원 배열로 변환해 줍니다.

예를 들어, y_train을 1D 배열로 변환하려면 다음과 같이 코드를 작성할 수 있습니다.

import numpy as np

y_train = np.ravel(y_train)

이렇게 해주시면 해당 경고 메시지를 해결할 수 있을 것입니다.

감사합니다.

자료 공유 질문

0

52

1

Ascii 에러 관련하여 질문드립니다

0

73

1

고차원 데이터 질문

0

46

0

test / train 데이터 나누기

0

93

1

세션4 범주형 데이터 분석 패턴 강의 질문

0

197

2

pandas 2.2.2, xgboost 2.1.3 에러 해결 방법

0

209

1

sklearn v1.5.1

0

166

1

머신러닝 적용을 위한 Feature Engineering 작업1

0

174

2

missingno 대체

0

163

1

scikit-learn 1.5.1 matplotlib 3.9.2

0

127

1

환불문의

0

259

1

자료공유를 받으려고 하는데 에러가 납니다.

0

154

1

iplot에서 항상 에러나는 분 안계신가용?

0

219

1

사망 여부 영향 가능성

0

139

1

섹션4_인코딩 이해하고 적용해보기(원핫인코딩) 질문

0

184

1

df.corr(numeric_only=True).iplot() 에러 해결 어떻게 해야되나요?

0

275

1

주피터 노트북 201_REGRESSION_BIKE_SHARING_MODELS 중 질문

0

242

1

3강 강의 자료 코드 관련 질문입니다

1

334

1

맥 사용자 mkdir .kaggle 했는데 파일이 안만들어집니다.

0

410

1

Bayesian Optimization에서 optimizer.maximize()함수를 더이상 지원 안한다고 합니다.

0

873

2

Bayesian Optimization LightGBM 적용

0

451

2

하이퍼 파라미터 튜닝 기법 적용하기 실행값이 미묘하게 달라요.

1

336

1

중복된 코드 수정 요청 - 자전거 공유 문제 이해와 EDA3

0

211

1

강의 중 에러 질문

0

736

1