작성
·
60
답변 1
0
작업형 3은 정답이 정해진 문제입니다.
따라서 C()
함수를 임의로 사용하면 정답과 다른 결과가 나올 수 있습니다.
문제에서 특정 컬럼이 명확하게 범주형이라고 지시한 경우에만C()
를 사용해주세요.
그 외에는 사용을 하지 말아주세요
다시 설명드리겠습니다.
로지스틱 회귀, 선형 회귀에서 숫자이지만 범주형 데이터로 느껴지는 것이 있다고 하더라도
(즉, info()를 확인했을 때는 int 또는 float임) 시험 문제에서 그 컬럼이 범주형 데이터란 말이 없으면
C()처리는 하지 말아주세요!
정답이 있는 문제로
문제에서 요구하는 부분만 작업하는 것이 명확합니다.
아 이해했습니다! 데이터 타입이 object인 칼럼은 C()를 하던 안하던 결과는 동일하네요.
데이터 타입이 int 또는 float인데, 시험 문제에서 해당 칼럼이 범주형 데이터라고 명시된 경우에만 C()처리를 하는 것으로 정리해두겠습니다. 감사합니다!
문제에서 특정 칼럼이 범주형이라고 지시한 경우라는게 헷갈립니다.
df.info()시 데이터 타입이 object인 경우는 범주형이라고 판단하고, 만약 문제에서 모델 구축시 데이터 타입이 object에 해당하는 변수를 포함해서 만들라는 지시가 있는 경우 C()로 묶으면 될까요..?