강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

최수영님의 프로필 이미지
최수영

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

피처 엔지니어링

스케일링, 인코딩 등 데이터 작업후에

해결된 질문

작성

·

47

0

스케일링, 인코딩 등 데이터 작업후에 위로 올라가서 다시 실행하면 처음이라 결과값이 달라지고 오류가 생기는데 한 번 실행한 작업은 다시 건드리면 안되나요? 라벨인코딩, 원핫인코딩 모두 실행하고 분리한 데이터 다시 합쳤을 때 컬럼이 107로 나와야하는데 처음이랑 그대로인 15가 나오더라구요 다시 올라가서 실행하니 전부 오류가 뜹니다 ㅜㅠ!!

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

코딩은 순서가 매우 중요한데

시험환경은 1개의 셀만 사용한다고 생각해 주세요

그런데 학습하는 상황에서 1개 셀만 사용하면 출력도 어렵고 학습속도가 느려져

여러개 셀을 권장하고 있어요

다만 이런 문제가 발생할 수 있는데

이럴 경우에는 현재 실행하고자하는 셀에 마우스 커서를 올려두고

"런타임 - 이전 셀 실행"을 클릭해주세요 그럼 처음부터 이전 셀까지 다시 실행합니다.

그리고 나서 현재 셀 실행하는 방식으로 진행해 주세요

0

안녕하세요, 인프런 AI 인턴입니다. 최수영님!

데이터 전처리 작업을 하다 보면 여러 번 실행하면서 원하는 결과를 얻으려는 경우가 많습니다. 아래 몇 가지 점을 유의하면 도움될 수 있습니다.

데이터 전처리 후 반복 실행 시 유의사항

  1. 데이터 복사본 사용: 데이터 전처리를 수행할 때 원본 데이터셋을 복사하여 작업하는 것이 좋습니다. 이를 통해 원본 데이터가 손상되지 않고 복잡한 전처리 과정을 안전하게 재실행할 수 있습니다.

    df_copy = df_original.copy()
    
  2. 단계별 스크립트 작성: 각 전처리 단계(인코딩, 스케일링 등)를 함수나 별도의 코드 셀로 구분하세요. 문제가 발생했을 때 특정 단계만 다시 테스트 가능합니다.

  3. 순차적 실행: 전처리 작업은 의존성이 있기 때문에 순서를 정확히 지켜야 합니다. 예를 들어, 인코딩 후에는 반드시 그 상태에서 합치거나 스케일링해야지, 전처리 이전의 원본 상태로 돌아가 단계를 건너뛰면 원하는 결과를 얻을 수 없습니다.

  4. 변경 사항 확인: 중간 결과를 확인할 수 있는 출력문을 삽입하여 데이터의 상태가 예상대로 변화하고 있는지 자주 확인하세요.

    print(df_copy.head())
    

관련하여 유사한 사례와 해결법을 설명한 게시물들을 안내드립니다:

라벨인코딩 및 원핫인코딩 후 결과가 예상과 다른 경우, 위 전처리 단계의 순서나 상태에 문제가 있었을 수 있으며, 이를 반복적으로 확인 및 조정해야 합니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

최수영님의 프로필 이미지
최수영

작성한 질문수

질문하기