inflearn logo
강의

Course

Instructor

[Side Project After Work] Big Data Analysis Certification Practical Exam (Type 1, 2, 3)

Two-way ANOVA

52강 이원분산분석

3

nncyj882873

4 asked

0

강사님 안녕하세요.

강의를 보다가 궁금증이 생겨서요.

 

49. 다중선형회귀2 (범주형 변수)

에서는 강사님이 스태츠 모델즈의 ols함수에서는

범주형 변수 가 포함되어있으면 이를 자동으로 인식하고 내부적으로 원-핫 인코딩 처리를 하므로 사용자가 별도로 범주형 변수를 수치형으로 변환하는 작업이 없어도 된다고 하셨는데,

 

52강 이원분산분석에서는

범주형 변수를 분석할때 c()를 사용해 범주형으로 처리해야한다고 하셔서요.

 

이원분산분석도 ols를 사용하는데

왜 다른지 궁금합니다.

 

확인 부탁드릴게요!

python 머신러닝 빅데이터 pandas 빅데이터분석기사

Answer 1

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. 연정님, 이원분산분석과 선형회귀에서의 ols 사용법에 대해 혼란을 느끼신 것 같습니다.

ols 함수는 범주형 변수를 자동으로 처리할 수 있습니다. 그러나 이 능력을 활용하는 방식은 회귀 분석과 분산분석에서 약간의 차이가 있습니다.

  1. 회귀 분석에서의 ols: 일반적으로 회귀 분석에서는 범주형 변수를 명시적으로 인코딩하지 않아도 ols 함수 내부에서 자동으로 처리하여 비교적 편리하게 사용할 수 있습니다. 즉, 포뮬러에 범주형 변수를 바로 넣어도 작동합니다.

  2. 분산분석에서의 ols: 반면, 이원분산분석에서는 범주형 변수를 명시적으로 C()로 감싸야 하는데, 이는 해당 변수를 범주형 데이터로 확실하게 인식시키기 위함입니다. 특히, 수치형으로 저장된 범주형 변수를 정교하게 다루기 위하여 필요한 조치입니다. 이렇게 함으로써 각 수준에 대한 정확한 분석과 해석이 가능합니다.

비슷한 주제에 대한 다른 유용한 답변을 제공하는 게시글게시글을 참고하시면 도움이 될 것입니다. 여기서 논의된 바와 같이, 자동 처리되어도 특정 경우에 수작업 처리가 요구될 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

실제시험환경에서 작업형1,2,3의 문제풀이 순서

0

7

1

독립표본검정

0

13

2

tranform을 쓰라는 힌트는 어디서 얻을 수 있나요??

0

18

2

df.describe() 사용을 자제해야할까요?

0

21

2

shape 결과에 대한 문의

0

21

2

자료 문의

0

16

1

8 회귀 11번

0

17

2

심화 강의 관련 질문

0

21

2

빈도수 구하는 것 질문

0

16

2

커리큘럼을 따로 인쇄할 수 있는 방법이 있을까요?

0

28

1

작업형2 머신러닝 문제풀이 중 test 데이터 에러 문의

0

29

2

수강연장가능문의

0

31

2

59. 11회 기출 유형 작업형 1 - 문제2 관련

0

26

2

원핫인코딩 슬라이싱 결과

0

23

2

random_state 값이 궁금합니다!

0

31

2

수강기간 연장 가능 여부 문의드립니다

0

50

2

city 컬럼 삭제

0

33

2

3회 기출(작업형 2) 질문 있습니다!!

0

33

1

2유형 탬플릿에 대한 질문입니다

0

48

1

시험환경 질문 드립니다.

0

39

1

수강기간 연장 가능 여부 문의드립니다

0

58

2

문제2-2에서 유의한 변수에서 음수는 유의한지?

0

45

3

강의 만료 후 오프라인 저장 강의 수강 가능 여부

0

51

2

xgboost에 관해

0

54

2