inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제2

작업형2 모의문제2

해결된 질문

43

JunSuPark

작성한 질문수 8

0

안녕하세요

 

혹시 문제에서는 전처리시에 열을 삭제하고,

cols = ['name', 'host_name', 'last_review', 'host_id']

열을 삭제하고,

 

값이 비어 있는거

train['reviews_per_month'] = train['reviews_per_month'].fillna(0)

test['reviews_per_month'] = test['reviews_per_month'].fillna(0)

 

이렇게 채우는게 문제에서 지시 사항이 없었는데, 작업을 해도 되는건가요?


명확한 지시 사항이 있어야 하는게 아닌가 싶어서 여쭤봅니다.

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

작업형 1과 3은 지시한 대로 반드시 풀어야 합니다. 정답이 있는 문제입니다.

작업형2는 예측 모델을 만들어서 예측을 하는 문제로 똑같은 결과가 나올 수 없어요. 모델의 성능이 잘 나오는 쪽으로 전처리 및 모델 학습이 필요한 문제에요 !!

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. JunSuPark님, 질문에 답변드리겠습니다.

데이터 분석 및 전처리 과정에서 열을 삭제하거나 결측치를 대체하는 등 데이터를 수정하는 작업은 일반적으로 문제의 지시 사항에 따라 수행되지만, 시험 환경에서는 명확한 지시 사항이 없더라도 데이터를 분석하고 결과를 도출하기 위한 합리적인 전처리를 해야 할 경우가 있습니다.

  1. 컬럼 삭제: ‘name’, ‘host_name’, ‘last_review’, ‘host_id’와 같은 열을 삭제하는 것은 해당 컬럼들이 분석에 기여하지 않거나, 직접적인 관련성이 낮을 때 가능합니다. 특히, 고유식별자와 같은 정보는 모델 성능에 직접적인 영향을 주지 않을 수 있어 제거하는 경우가 많습니다.

  2. 결측치 처리: train[‘reviews_per_month’]의 결측치를 0으로 대체하는 작업은 데이터가 결측일 가능성이 높은 이유(예를 들어, 리뷰가 없기 때문에 0으로 처리) 등에 기반하여 합리적으로 수행할 수 있습니다. 비즈니스 측면에서의 논리나 주어진 데이터셋의 특성을 고려하여 결측치를 대체하는 것은 일반적인 관행입니다.

시험 환경에서는 데이터의 전처리 작업이 필수적일 수 있으며, 모든 가능한 조치를 명확하게 명시하지 않을 수 있습니다. 따라서 주어진 데이터를 판단하여 합리적인 전처리 방안을 적용하는 것이 중요합니다. 이는 항상 문제의 맥락과 데이터 세트의 특성을 고려하면서 수행되어야 합니다.

이전에 유사한 질문과 답변이 있었던 게시글을 통해 더 많은 정보를 얻을 수 있습니다:

이 게시글에서는 열 삭제와 결측치 처리 방법에 대한 사례를 제공합니다. 특히, 데이터 전처리에서 열 삭제와 결측치 처리에 대한 고민을 어떻게 해결할 수 있는지 확인할 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

1유형 강의 다 나간 후 어떻게 할까요?

0

3

1

점수차가 많이 나는데 따로 하신게 있으신가요?

0

5

1

작업형1 강의 수강 완료 후..

0

12

0

작업형1 모의문제 4번에 3)문제 질문

0

17

2

이상치 전처리 작업

0

25

2

평가결과값 문의

0

28

2

시계열 데이터 날짜와 시간 format

0

31

2

평가지표 F1 스코어 질문드립니다.

0

26

2

작업형 2 기출7회분에서

0

38

2

작업형2 모의문제1 (30강)

0

34

2

수강 기간 연장 문의 드립니다.

0

41

2

수강 계획과 관련해 문의 드립니다.

0

29

2

작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?

0

50

2

작업형 1 -연습문제 4-6

0

38

2

작업형 1 유형 부분

0

42

2

작업형 1 (삭제예정, 구 버전)

0

51

2

수강기간 연장 문의드립니다.

0

38

2

2유형 레이블 인코딩 VS 원핫 인코딩

0

37

3

수강기간 연장 문의드립니다.

0

44

2

인덱스 슬라이싱

0

37

2

질문 드립니다.

0

50

2

강의 내용 관련 질문드립니다~

0

46

2

수강 연장 문의

0

63

2

강의자료 일괄 다운로드

0

61

2