inflearn logo
강의

講義

知識共有

[仕事終わりの趣味] ビッグデータ分析実技 (作業型1,2,3)

一元配置分散分析

C()

2

nine141417329586

投稿した質問数 3

0

회귀와 로지스틱 회귀 문제에서 데이터가 숫자이지만 범주형 변수라고 지정할 때에만 C()를 붙여야 한다고 하셨는데

 

"일원분산분석"과 "이원분산분석"에서는 ols()에서 모든 독립변수에 C()를 붙여도 되는 것이 맞나요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

回答 1

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. 토우마님께서 질문해주신 내용에 대해 설명드리겠습니다.

분산분석과 회귀 분석에서 C() 함수의 사용에 대해 혼란스러우실 수 있습니다. C() 함수는 범주형 데이터를 명시적으로 지정하기 위해 사용됩니다. 특정 상황에서는 사용법이 달라질 수 있습니다:

  1. 일원/이원 분산분석: 이 상황에서는 모든 독립변수가 범주형으로 해석됩니다. 따라서 ols() 함수에서 모든 독립변수 앞에 C()를 붙이는 것이 일반적입니다. 이는 변수가 실제로 수치형으로 보일 수 있지만, 그 변수를 범주형으로 취급해야 하는 경우에 특히 필요합니다.

  2. 회귀 및 로지스틱 회귀 분석: 경우에 따라 다릅니다. 여기서는 범주형 변수를 명시적으로 나타내기 위해 C()를 사용하는데, 만약 데이터가 숫자지만 범주형으로 해석되어야 한다면 숫자에서 범주형으로 명확히 구분이 필요할 때 C()를 사용하여 이를 처리합니다. 모든 변수에 무작정 C()를 사용하는 것은 올바르지 않습니다.

더 깊이 있는 이해를 위해 유용한 추가 자료를 참고하실 수 있습니다:
- 회귀분석에서의 C() 사용법
- 분산분석에서 C(변수)의 활용

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

작업형 2에서 strafity 적용 유무

0

6

2

수강 기간 연장 가능 여부 문의드립니다.

0

9

1

ols

0

10

2

2유형 작성관련 질문(일반 심화)

0

14

2

2유형 작성관련 질문

0

10

2

2유형 object컬럼 개수 다르면

0

14

2

코딩팡질문이요ㅠㅠ

0

14

2

관찰값과 기대값의 개념이 헷갈립니다.

0

12

2

작업형2 ID 컬럼 삭제 질문

0

21

2

2유형 작성관련 질문

0

15

2

memoryerror 질문

0

14

2

작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?

0

15

1

ID 삭제 필수 인가요?

0

18

3

7회 기출문제 작업형1번 df 변환 후 저장되는 방식 질문

0

15

2

3 유형 귀무가설, 대립가설

0

19

2

인코딩 관련 질문 있습니다

0

22

2

작업형3 이원분산분석 sm에서불러오기 / anova_lm 차이

0

21

2

2유형 원핫인코딩 오류

0

22

2

시험장에서 주석 단축키 안될 때 많나요?

0

26

2

라벨인코딩 방식

0

24

2

test 재학습 관련

0

16

2

target 빈도 확인

0

17

2

작업형 2 연습문제 섹션 6

0

20

2

F1-score

0

19

2