캐글에 올려주신 작업형 3유형 C로 감싸는 경우 문의
formula 를 작성할때 C 를 감싸는 경우는 문자값이지만 수치형일 경우 감싸는 사항아닌가요? C 를 붙이는지 안붙이는지에 따라서 결과값이 달라지네요.
아래 Pclass 는 수치형인데 C 가 붙혀져서 질문드려 봅니다.
import pandas as pd from statsmodels.formula.api import logit df = pd.read_csv("/kaggle/input/bigdatacertificationkr/Titanic.csv") formula = "Survived ~ C(Pclass) + Gender + SibSp + Parch" model = logit(formula, data=df).fit() model.params

답변 1
0
문자값이지만 수치형일 경우 감싸는 사항아닌가요?
문자값이지만 수치형일 경우라는 것이 무슨말일까요?
C()에 대해 정리하면
범주형 데이터 : C()를 사용하지 않더라도 자동으로 원핫인코딩 처리 합니다.
연속형 데이터 : 데이터는 숫자이지만 범주형이라고 만약 문제에 명시가 되었다면 별도 처리가 필요해요. 이 때 C() 로 감사주면 됩니다.
0
수치형이지만 오브젝트형 인 경우를 말씀드렸어요. 1,2,3인데 오브젝트인 경우입니다. 그 경우에 C로 감싸야한다고 들었는데요.
Pclass 타입이 Int 인 경우에도 C로 감싸게 정답이 되어있어서 어떠한 경우인지 질문드러 봅니다.
0
제가 설명을 잘못했거나, 잘못 이해하셨어요!
1,2,3은 object 데이터일 가능성은 거의 없습니다.
int또는 float이겠지요~
이때 문제에서 숫자이지만 범주형이라고 만약 명시 한다면 C()로 처리해주세요 🙂
질문 드립니다.
0
38
2
강의 내용 관련 질문드립니다~
0
35
2
수강 연장 문의
0
33
1
강의자료 일괄 다운로드
0
43
2
수강기간 연장 문의드립니다
0
29
1
list 문제 질문드립니다~
0
31
2
빅분기 실기 12회 재도전
0
40
1
강의 기간 연장 가능여부 검토 요청건
0
30
1
수강기간 연장 문의 드립니다
0
36
2
수강기간 연장 문의드립니다
0
47
2
질문이요
0
51
2
수강기간 연장 문의드립니다.
0
50
2
문제 3-2 질문드립니다
0
44
2
수강기간 연장 문의 드립니다.
0
58
2
변수, 칼럼 , df 구분
0
50
2
수강기간 연장 문의드립니다.
0
50
2
수강기간 연장 문의
0
48
2
수강기간 연장 문의드립니다.
0
42
2
수강기한 연장 문의
0
80
2
수강기간 연장 문의드립니다
0
57
2
결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유
0
45
2
수강기간 연장 문의드립니다.
0
71
2
수강연장 문의
0
77
2
수강연장문의
0
53
2





