강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

hara0203님의 프로필 이미지
hara0203

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형3(ver. 2023-2) / 로지스틱 회귀 내용 포함(필수)

예시문제 작업형3 (신버전) 질문입니다.

작성

·

60

0

예시문제 작업형3 (신버전) 문제의 제공된 데이터에서

로지스틱 회귀 모델 생성시 C()로 묶어서 처리해야하는 데이터는

Survived, Pdass, Gender, Embarked 뿐인게 맞나요??

문제에는 Gender밖에 사용되지 않았지만 만약 위의 변수들도 포함해서 회귀 모형을 만들라는 지시가 있었을때 C()로 묶는게 맞는지 여쭤봅니다

image.png

!

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

작업형 3은 정답이 정해진 문제입니다.

따라서 C() 함수를 임의로 사용하면 정답과 다른 결과가 나올 수 있습니다.
문제에서 특정 컬럼이 명확하게 범주형이라고 지시한 경우에만C()를 사용해주세요.
그 외에는 사용을 하지 말아주세요

 

hara0203님의 프로필 이미지
hara0203
질문자

문제에서 특정 칼럼이 범주형이라고 지시한 경우라는게 헷갈립니다.

df.info()시 데이터 타입이 object인 경우는 범주형이라고 판단하고, 만약 문제에서 모델 구축시 데이터 타입이 object에 해당하는 변수를 포함해서 만들라는 지시가 있는 경우 C()로 묶으면 될까요..?

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

다시 설명드리겠습니다.

로지스틱 회귀, 선형 회귀에서 숫자이지만 범주형 데이터로 느껴지는 것이 있다고 하더라도

(즉, info()를 확인했을 때는 int 또는 float임) 시험 문제에서 그 컬럼이 범주형 데이터란 말이 없으면

C()처리는 하지 말아주세요!

정답이 있는 문제로
문제에서 요구하는 부분만 작업하는 것이 명확합니다.

hara0203님의 프로필 이미지
hara0203
질문자

아 이해했습니다! 데이터 타입이 object인 칼럼은 C()를 하던 안하던 결과는 동일하네요.

데이터 타입이 int 또는 float인데, 시험 문제에서 해당 칼럼이 범주형 데이터라고 명시된 경우에만 C()처리를 하는 것으로 정리해두겠습니다. 감사합니다!

 

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네:) 화이팅!!

hara0203님의 프로필 이미지
hara0203

작성한 질문수

질문하기