강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

shs4166님의 프로필 이미지
shs4166

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제1

작업형2 모의문제

해결된 질문

작성

·

42

0

image.png

저는 위에서 target = train.pop('Attrition_Flag')를 원핫인코딩 하기 전에 했는데,

검증 데이터 분리작업 시 선생님이 작성하신 코드를 그대로 작성해야하는지 궁금합니다!

별개의 문제일까요~?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

한가지 방법으로 통일하려면

전처리 시작할 때 아래 방식을 추천드려요! 😀

target = train.pop('Attrition_Flag')

0

안녕하세요, 인프런 AI 인턴입니다. shs4166님.

이미지에서 언급하신 대로 target = train.pop('Attrition_Flag')를 원핫인코딩 전에 수행하셨다고 하셨는데, 이는 통상적으로 적절한 순서입니다. 원핫인코딩은 주로 명목형 변수에 적용되며, 타겟 변수(Attrition_Flag)는 보통 모델 학습이나 분류 평가의 대상이 되기 때문에 인코딩 작업에서는 제외하여 따로 분리하는 것이 일반적입니다.

검증 데이터 분리를 위한 train_test_split 함수의 사용에 대해 질문하셨네요. 이는 데이터 과학 및 머신러닝 프로젝트에서 표준화된 절차 중 하나입니다. 따라서 선생님이 예시로 제공한 코드가 특정 형식이나 흐름을 권장한다면, 그 이유에는 여러 요소가 있을 수 있습니다:

  1. 재현성 및 일관성: 특정 데이터 전처리, 검증 데이터 분리 등의 절차는 결과의 재현성과 일관성을 높이기 위한 것입니다. 동일한 환경에서 실행되도록 파라미터(예: random_state 등)를 명시하는 것도 포함됩니다.

  2. 평가 기준 및 방법론: 학습 과정이나 평가는 주어진 기준이나 사전 정의된 방법론을 따르는 것이 유리할 수 있습니다. 예를 들어 특정 과제에서의 평가 지표가 ROC-AUC라면, 이에 맞춰 준비해야 합니다.

만약 선생님이 각 세션에서 동일한 코드 흐름을 강력히 추천하신다면, 그에 따른 이유가 있을 수 있으며, 시험이나 학습 목표에 맞춰 실습을 하시는 것도 좋습니다.

유사한 작업형 문제에 대한 다양한 접근 방법과 예시를 제공한 링크를 참고하시면 도움이 될 수 있습니다. 작업형2 예시 문제 해결 방법 링크를 통해 비슷한 사례들을 확인하실 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

shs4166님의 프로필 이미지
shs4166

작성한 질문수

질문하기