머신러닝 적용을 위한 Feature Engineering 작업1
174
작성자 없음
작성한 질문수 0
(05:51) Sex 숫자 변환 부분에서 코드를 똑같이 실행했지만 df['Sex']를 출력하면 강의내용과 다르게 NaN값으로 다 변환됩니다.

답변 2
0
안녕하세요. 답변 도우미입니다.
동일 수업자료로 금일 테스트해보았을 때, 다음과 같이 정상적으로 출력이 됩니다.

혹시 괜찮으시면, 수업자료를 다시 새로 다운받으셔서 한번 해보시는 것도 좋을 것 같고요. 보여주신 부분만으로만 봐서는 동일 코드인 것 같은데, 이전에 데이터가 이미 수정이 되어있어서 다른 데이터를 로드하여 이슈가 있을 수 있을 수도 있을 것 같습니다. 이런 부분은 아마 수업자료를 새로 다른 폴더에 다운받으셔서 그대로 실행해보시면서 기존 코드나 데이터와 어떤 부분이 이슈가 있는지 확인해보시는 것도 도움이 될 것 같습니다.
감사합니다.
0
안녕하세요, 인프런 AI 인턴입니다.
0715ksj님께서 문의하신 “Sex” 컬럼이 NaN으로 변환되는 문제에 대해 답변 드리겠습니다.
두 가지 원인과 해결 방법을 소개해 드리겠습니다.
대소문자 불일치 문제:
gender = {"male": 0, "female": 1}로 대소문자 구분 없이 작성되어 있지만, 데이터프레임의 “Sex” 컬럼에 대문자나 다른 변형이 있을 경우 문제가 생길 수 있습니다. 예를 들어, “Male” 또는 “Female”과 같은 형식이 있다면map메소드가 이를 인식하지 못합니다.
- 해결 방법:
df['Sex'] = df['Sex'].str.lower().map(gender)이 코드를 통해 “Sex” 컬럼의 값을 모두 소문자로 변환한 후 매핑을 시도할 수 있습니다.
매핑 데이터 부족:
- “Sex” 컬럼에 예상치 못한 다른 값이 포함된 경우에도 NaN이 발생할 수 있습니다.
- 검증 방법:
unique_values = df['Sex'].unique() print(unique_values)이 코드를 통해 컬럼에 어떤 값들이 있는지 확인해보세요.
- “Sex” 컬럼에 예상치 못한 다른 값이 포함된 경우에도 NaN이 발생할 수 있습니다.
추가적인 예시를 원하시거나 다른 문제가 발생할 경우, 두 개의 검증 방법을 적용해 보시고 문제가 지속된다면 자세한 데이터를 공유해주시면 보다 정확한 솔루션을 제공할 수 있도록 노력하겠습니다.
관련하여 유사한 문제가 논의된 기존 Q&A 게시물은 에러 해결과 프로그래밍 실습에서 확인하실 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
자료 공유 질문
0
52
1
Ascii 에러 관련하여 질문드립니다
0
73
1
고차원 데이터 질문
0
46
0
test / train 데이터 나누기
0
93
1
세션4 범주형 데이터 분석 패턴 강의 질문
0
197
2
pandas 2.2.2, xgboost 2.1.3 에러 해결 방법
0
209
1
sklearn v1.5.1
0
166
1
missingno 대체
0
163
1
scikit-learn 1.5.1 matplotlib 3.9.2
0
127
1
환불문의
0
259
1
자료공유를 받으려고 하는데 에러가 납니다.
0
154
1
iplot에서 항상 에러나는 분 안계신가용?
0
219
1
사망 여부 영향 가능성
0
139
1
섹션4_인코딩 이해하고 적용해보기(원핫인코딩) 질문
0
184
1
df.corr(numeric_only=True).iplot() 에러 해결 어떻게 해야되나요?
0
275
1
주피터 노트북 201_REGRESSION_BIKE_SHARING_MODELS 중 질문
0
242
1
3강 강의 자료 코드 관련 질문입니다
1
334
1
맥 사용자 mkdir .kaggle 했는데 파일이 안만들어집니다.
0
410
1
Bayesian Optimization에서 optimizer.maximize()함수를 더이상 지원 안한다고 합니다.
0
873
2
Bayesian Optimization LightGBM 적용
0
451
2
하이퍼 파라미터 튜닝 기법 적용하기 실행값이 미묘하게 달라요.
1
336
1
중복된 코드 수정 요청 - 자전거 공유 문제 이해와 EDA3
0
211
1
강의 중 에러 질문
0
736
1
cross_val_score 에러
0
455
1





