다중선형회귀2(범주형 변수) 질문있습니다.
위의 다중선형회귀에서 유형 칼럼은 범주형 변수인데,
C(유형) 으로 안해줘도 되나요?
Câu trả lời 3
0
안녕하세요, 인프런 AI 인턴입니다.
munjihey1127님께서 질문하신 “다중선형회귀에서 범주형 변수 처리”에 대한 내용을 확인하였고, 관련된 내용이 포함된 답변을 찾았습니다.
범주형 변수를 ols 함수에서 처리하는 방법에 대한 구체적인 설명이 궁금하신 것으로 보입니다. 여러 질문 중에, “작3 회귀분석 범주형데이터처리” 질문에서 비슷한 주제로 답변을 확인할 수 있습니다.
해당 답변에 따르면, “이경우 회귀분석에 범주형 데이터가 있는데
from statsmodels.formula.api import ols
model = ols('매출액 ~ 광고비 + C(유형)', data=df).fit()
print(model.summary())
이렇게 써도 된다구 하셨죠??” 에 대해 지식공유자가 “네 이건 유형자체가 object여서 C()안써도 결과가 똑같을 것 같습니다.” 라고 답변하신 내용입니다.
이 답변은 범주형 변수가 ols 함수 내에서 C() 함수를 사용하여 명시적으로 처리할 필요가 있는지에 대한 질문에 대한 답본으로, 만약 변수가 object 타입이라면 C() 함수를 사용하지 않아도 ols 모델이 해당 변수를 범주형으로 인식하여 처리할 수 있음을 의미합니다. 그러나 범주형 변수가 숫자 등의 다른 타입으로 표현된 경우, C() 함수를 사용하여 명시적으로 범주형임을 나타내야 할 수도 있습니다.
이 정보가 munjihey1127님의 질문에 대한 답변이 되기를 바랍니다. 범주형 데이터를 다루는 데 있어 C() 함수의 사용 여부는 데이터의 타입과 모델이 인식하는 방식에 따라 달라질 수 있으므로, 해당 상황에 맞게 적절히 적용하는 것이 중요합니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
원핫인코딩과 레이블 인코딩에서 concat
0
11
2
제2유형 질문입니다.
0
22
2
C()
0
18
2
작업형 2에서 strafity 적용 유무
0
25
2
수강 기간 연장 가능 여부 문의드립니다.
0
19
1
ols
0
22
2
2유형 작성관련 질문(일반 심화)
0
22
2
2유형 작성관련 질문
0
19
2
2유형 object컬럼 개수 다르면
0
22
2
코딩팡질문이요ㅠㅠ
0
23
2
관찰값과 기대값의 개념이 헷갈립니다.
0
13
2
작업형2 ID 컬럼 삭제 질문
0
23
2
2유형 작성관련 질문
0
21
2
memoryerror 질문
0
18
2
작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?
0
21
1
ID 삭제 필수 인가요?
0
19
3
7회 기출문제 작업형1번 df 변환 후 저장되는 방식 질문
0
16
2
3 유형 귀무가설, 대립가설
0
20
2
인코딩 관련 질문 있습니다
0
24
2
작업형3 이원분산분석 sm에서불러오기 / anova_lm 차이
0
29
2
2유형 원핫인코딩 오류
0
23
2
시험장에서 주석 단축키 안될 때 많나요?
0
29
2
라벨인코딩 방식
0
29
2
test 재학습 관련
0
18
2

