ols
3
2 asked
6:27초에서 df_metl에 존재하는 variable 변수가 범주형 변수인데 ols('value ~ C(variable)', ~~~~) 이런 식으로 적지 않아도 되나요? 영상에서는 C로 감싸지 않았는데요
Answer 1
0
안녕하세요, 인프런 AI 인턴입니다. 토우마님!
범주형 변수를 다룰 때, ‘C()‘로 감싸는 방식에 대해 궁금해하시는군요. 기본적으로 ‘C()‘는 범주형 변수를 명시적으로 처리하여 더미 변수로 변환하는 역할을 합니다. 많은 경우, ‘ols()’ 함수는 범주형 변수를 자동으로 인식하고 처리할 수 있지만, 데이터가 숫자형으로 저장되어 있고 범주형으로 취급하고자 한다면 ‘C()‘로 감싸주는 것이 좋습니다.
이와 관련하여 이미 많은 분들이 유사한 질문을 주셨으며, 관련 답변이 범주형 변수일 때 formula 질문과 작업형3(신 버전) 문의 게시물에서 다뤄지고 있습니다. 이러한 게시물을 참고하시면 범주형 변수 처리에 대한 깊이 있는 이해에 도움이 될 것입니다.
결론적으로, 자동 처리 기능을 유념하면서도 데이터와 상황에 맞춰 명시적으로 ‘C()‘를 사용하는 것도 좋은 습관이 될 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
수강 기간 연장 가능 여부 문의드립니다.
0
4
1
2유형 작성관련 질문(일반 심화)
0
11
1
2유형 작성관련 질문
0
9
1
2유형 object컬럼 개수 다르면
0
10
1
코딩팡질문이요ㅠㅠ
0
13
1
관찰값과 기대값의 개념이 헷갈립니다.
0
11
1
작업형2 ID 컬럼 삭제 질문
0
20
2
2유형 작성관련 질문
0
10
1
memoryerror 질문
0
12
1
작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?
0
13
0
ID 삭제 필수 인가요?
0
17
3
7회 기출문제 작업형1번 df 변환 후 저장되는 방식 질문
0
13
1
3 유형 귀무가설, 대립가설
0
19
2
인코딩 관련 질문 있습니다
0
21
2
작업형3 이원분산분석 sm에서불러오기 / anova_lm 차이
0
21
2
2유형 원핫인코딩 오류
0
22
2
시험장에서 주석 단축키 안될 때 많나요?
0
26
2
라벨인코딩 방식
0
24
2
test 재학습 관련
0
15
2
target 빈도 확인
0
17
2
작업형 2 연습문제 섹션 6
0
20
2
F1-score
0
19
2
작업형 2번 섹션 3
0
18
2
작업형 2 인코딩, 결측치, 모델 선택 질문
0
22
1

