캐글에 올려주신 작업형 3유형 C로 감싸는 경우 문의
formula 를 작성할때 C 를 감싸는 경우는 문자값이지만 수치형일 경우 감싸는 사항아닌가요? C 를 붙이는지 안붙이는지에 따라서 결과값이 달라지네요.
아래 Pclass 는 수치형인데 C 가 붙혀져서 질문드려 봅니다.
import pandas as pd from statsmodels.formula.api import logit df = pd.read_csv("/kaggle/input/bigdatacertificationkr/Titanic.csv") formula = "Survived ~ C(Pclass) + Gender + SibSp + Parch" model = logit(formula, data=df).fit() model.params

답변 1
0
문자값이지만 수치형일 경우 감싸는 사항아닌가요?
문자값이지만 수치형일 경우라는 것이 무슨말일까요?
C()에 대해 정리하면
범주형 데이터 : C()를 사용하지 않더라도 자동으로 원핫인코딩 처리 합니다.
연속형 데이터 : 데이터는 숫자이지만 범주형이라고 만약 문제에 명시가 되었다면 별도 처리가 필요해요. 이 때 C() 로 감사주면 됩니다.
0
수치형이지만 오브젝트형 인 경우를 말씀드렸어요. 1,2,3인데 오브젝트인 경우입니다. 그 경우에 C로 감싸야한다고 들었는데요.
Pclass 타입이 Int 인 경우에도 C로 감싸게 정답이 되어있어서 어떠한 경우인지 질문드러 봅니다.
0
제가 설명을 잘못했거나, 잘못 이해하셨어요!
1,2,3은 object 데이터일 가능성은 거의 없습니다.
int또는 float이겠지요~
이때 문제에서 숫자이지만 범주형이라고 만약 명시 한다면 C()로 처리해주세요 🙂
원핫인코딩과 레이블 인코딩에서 concat
0
9
2
제2유형 질문입니다.
0
20
2
C()
0
18
2
작업형 2에서 strafity 적용 유무
0
23
2
수강 기간 연장 가능 여부 문의드립니다.
0
18
1
ols
0
20
2
2유형 작성관련 질문(일반 심화)
0
21
2
2유형 작성관련 질문
0
19
2
2유형 object컬럼 개수 다르면
0
20
2
코딩팡질문이요ㅠㅠ
0
22
2
관찰값과 기대값의 개념이 헷갈립니다.
0
13
2
작업형2 ID 컬럼 삭제 질문
0
23
2
2유형 작성관련 질문
0
20
2
memoryerror 질문
0
18
2
작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?
0
21
1
ID 삭제 필수 인가요?
0
19
3
7회 기출문제 작업형1번 df 변환 후 저장되는 방식 질문
0
16
2
3 유형 귀무가설, 대립가설
0
20
2
인코딩 관련 질문 있습니다
0
24
2
작업형3 이원분산분석 sm에서불러오기 / anova_lm 차이
0
27
2
2유형 원핫인코딩 오류
0
23
2
시험장에서 주석 단축키 안될 때 많나요?
0
29
2
라벨인코딩 방식
0
29
2
test 재학습 관련
0
17
2





