강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

wlysh999님의 프로필 이미지
wlysh999

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(ver. 2023)

(체험) 제2유형 -빅데이터분석기사

해결된 질문

작성

·

36

0

 

아래 시험환경 TEST하기 제2유형 풀어보고있는데요.

아래사진과같이 test.info()했을때,

최대구매액

환불금액

수량이 달라서 null값이 있는걸로 확인됩니다.

 

해당 건 dropna() 진행하나요?

아니면 그냥 문제풀어도 상관없는지 문의드립니다.

 

 

image.png

 

https://dataq.goorm.io/exam/116674/체험하기/quiz/4

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

예시문제 강의 영상대로 부탁드립니다 🙌

삭제 또는 채움으로 전처리가 필요해요

처리하지 않고는 모델에 넣을 수가 없어요

0

안녕하세요, 인프런 AI 인턴입니다. wlysh999님 질문 감사드립니다.

질문하신 내용을 살펴보니, test 데이터셋에서 결측치(null 값)가 존재하여 이를 처리할지 여부를 고민하시는 것 같습니다. 데이터 분석 과정에서 결측치를 어떻게 처리하느냐에 따라 결과가 크게 달라질 수 있습니다. 일반적으로 결측치를 처리하는 방법으로는 삭제(dropna), 대체(예: 평균값이나 중앙값으로 대체), 또는 분석의 목적에 따라 특별히 처리하지 않는 방법 등이 있습니다.

  1. 결측치(dropna): 자동으로 전체 행이 삭제되게 되어 데이터 샘플이 줄어들 수 있습니다. 데이터의 손실이 크다면 이 방법은 추천하지 않습니다.

  2. 결측값을 0으로 대체 또는 평균/중앙값 대체: 이 방법은 데이터를 최대한 보존하면서 분석을 진행하기 위한 전처리 방법 중 하나입니다.

  3. 문제 요구사항 확인: 주어진 문제의 요구사항에 따라 결측치 처리 방식을 결정하세요. 시험 유형이나 문제의 지시에 따라 결측치를 반드시 특정 방식으로 처리해야 할 수도 있습니다. 이러한 경우 지시에 따르는 것이 중요합니다.

아래 유사한 질문 답변을 참고하시면 도움이 될 것 같습니다:
- 예시문제 작업형 2번 질문 있습니다!!

이 게시물에서는 증가된 전처리의 난이도와 각 데이터 프레임의 결측값을 처리하기 위한 다양한 옵션들이 제시되고 있습니다. 결측치를 처리하기 전에 데이터의 특성을 고려하여 최적의 방법을 선택하는 것이 좋습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

wlysh999님의 프로필 이미지
wlysh999

작성한 질문수

질문하기