inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]

머신러닝 적용을 위한 Feature Engineering 작업1 (업데이트)

머신러닝 적용을 위한 Feature Engineering 작업1

174

작성자 없음

작성한 질문수 0

0

(05:51) Sex 숫자 변환 부분에서 코드를 똑같이 실행했지만 df['Sex']를 출력하면 강의내용과 다르게 NaN값으로 다 변환됩니다.

ㅇㅇㅇㅇ.png.webp

python 머신러닝 pandas kaggle

답변 2

0

잔재미코딩 DaveLee

안녕하세요. 답변 도우미입니다.

동일 수업자료로 금일 테스트해보았을 때, 다음과 같이 정상적으로 출력이 됩니다.

CleanShot 2025-01-26 at 19.09.21.png

혹시 괜찮으시면, 수업자료를 다시 새로 다운받으셔서 한번 해보시는 것도 좋을 것 같고요. 보여주신 부분만으로만 봐서는 동일 코드인 것 같은데, 이전에 데이터가 이미 수정이 되어있어서 다른 데이터를 로드하여 이슈가 있을 수 있을 수도 있을 것 같습니다. 이런 부분은 아마 수업자료를 새로 다른 폴더에 다운받으셔서 그대로 실행해보시면서 기존 코드나 데이터와 어떤 부분이 이슈가 있는지 확인해보시는 것도 도움이 될 것 같습니다.

 

감사합니다.

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

0715ksj님께서 문의하신 “Sex” 컬럼이 NaN으로 변환되는 문제에 대해 답변 드리겠습니다.

두 가지 원인과 해결 방법을 소개해 드리겠습니다.

  1. 대소문자 불일치 문제:

    • gender = {"male": 0, "female": 1} 로 대소문자 구분 없이 작성되어 있지만, 데이터프레임의 “Sex” 컬럼에 대문자나 다른 변형이 있을 경우 문제가 생길 수 있습니다. 예를 들어, “Male” 또는 “Female”과 같은 형식이 있다면 map 메소드가 이를 인식하지 못합니다.
    • 해결 방법:
    df['Sex'] = df['Sex'].str.lower().map(gender)
    

    이 코드를 통해 “Sex” 컬럼의 값을 모두 소문자로 변환한 후 매핑을 시도할 수 있습니다.

  2. 매핑 데이터 부족:

    • “Sex” 컬럼에 예상치 못한 다른 값이 포함된 경우에도 NaN이 발생할 수 있습니다.
    • 검증 방법:
    unique_values = df['Sex'].unique()
    print(unique_values)
    

    이 코드를 통해 컬럼에 어떤 값들이 있는지 확인해보세요.

추가적인 예시를 원하시거나 다른 문제가 발생할 경우, 두 개의 검증 방법을 적용해 보시고 문제가 지속된다면 자세한 데이터를 공유해주시면 보다 정확한 솔루션을 제공할 수 있도록 노력하겠습니다.

관련하여 유사한 문제가 논의된 기존 Q&A 게시물은 에러 해결과 프로그래밍 실습에서 확인하실 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

자료 공유 질문

0

52

1

Ascii 에러 관련하여 질문드립니다

0

73

1

고차원 데이터 질문

0

46

0

test / train 데이터 나누기

0

93

1

세션4 범주형 데이터 분석 패턴 강의 질문

0

197

2

pandas 2.2.2, xgboost 2.1.3 에러 해결 방법

0

209

1

sklearn v1.5.1

0

166

1

missingno 대체

0

163

1

scikit-learn 1.5.1 matplotlib 3.9.2

0

127

1

환불문의

0

259

1

자료공유를 받으려고 하는데 에러가 납니다.

0

154

1

iplot에서 항상 에러나는 분 안계신가용?

0

219

1

사망 여부 영향 가능성

0

139

1

섹션4_인코딩 이해하고 적용해보기(원핫인코딩) 질문

0

184

1

df.corr(numeric_only=True).iplot() 에러 해결 어떻게 해야되나요?

0

275

1

주피터 노트북 201_REGRESSION_BIKE_SHARING_MODELS 중 질문

0

242

1

3강 강의 자료 코드 관련 질문입니다

1

334

1

맥 사용자 mkdir .kaggle 했는데 파일이 안만들어집니다.

0

410

1

Bayesian Optimization에서 optimizer.maximize()함수를 더이상 지원 안한다고 합니다.

0

873

2

Bayesian Optimization LightGBM 적용

0

451

2

하이퍼 파라미터 튜닝 기법 적용하기 실행값이 미묘하게 달라요.

1

336

1

중복된 코드 수정 요청 - 자전거 공유 문제 이해와 EDA3

0

211

1

강의 중 에러 질문

0

736

1

cross_val_score 에러

0

455

1