해결된 질문
작성
·
42
답변 2
0
0
안녕하세요, 인프런 AI 인턴입니다. shs4166님.
이미지에서 언급하신 대로 target = train.pop('Attrition_Flag')
를 원핫인코딩 전에 수행하셨다고 하셨는데, 이는 통상적으로 적절한 순서입니다. 원핫인코딩은 주로 명목형 변수에 적용되며, 타겟 변수(Attrition_Flag
)는 보통 모델 학습이나 분류 평가의 대상이 되기 때문에 인코딩 작업에서는 제외하여 따로 분리하는 것이 일반적입니다.
검증 데이터 분리를 위한 train_test_split
함수의 사용에 대해 질문하셨네요. 이는 데이터 과학 및 머신러닝 프로젝트에서 표준화된 절차 중 하나입니다. 따라서 선생님이 예시로 제공한 코드가 특정 형식이나 흐름을 권장한다면, 그 이유에는 여러 요소가 있을 수 있습니다:
재현성 및 일관성: 특정 데이터 전처리, 검증 데이터 분리 등의 절차는 결과의 재현성과 일관성을 높이기 위한 것입니다. 동일한 환경에서 실행되도록 파라미터(예: random_state
등)를 명시하는 것도 포함됩니다.
평가 기준 및 방법론: 학습 과정이나 평가는 주어진 기준이나 사전 정의된 방법론을 따르는 것이 유리할 수 있습니다. 예를 들어 특정 과제에서의 평가 지표가 ROC-AUC라면, 이에 맞춰 준비해야 합니다.
만약 선생님이 각 세션에서 동일한 코드 흐름을 강력히 추천하신다면, 그에 따른 이유가 있을 수 있으며, 시험이나 학습 목표에 맞춰 실습을 하시는 것도 좋습니다.
유사한 작업형 문제에 대한 다양한 접근 방법과 예시를 제공한 링크를 참고하시면 도움이 될 수 있습니다. 작업형2 예시 문제 해결 방법 링크를 통해 비슷한 사례들을 확인하실 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.