inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[작업형3] 4~5 분산 분석

[작업형3] 5. 이원분산분석

해결된 질문

63

semistone6239

작성한 질문수 9

0

데이터를 보면 비료유형만 범주형변수인데

물주기까지 C(물주기) 처리하는 이유가 궁금합니다.

기준이뭔가요?

C(비료유형) * 물주기 하면 둘다 C처리 안한거랑 결과같은데

둘다 C처리해주면 결과가 바뀌네요..

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

ANOVA는 기본적으로 “집단 간 평균 차이”를 비교하는 분석이기 때문에,
요인이 숫자로 되어 있어도 그것이 “집단 구분용”이면 범주형으로 처리해야 합니다.

 

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

semistone6239님께서 질문하신 “C” 함수 사용에 대한 부분은 모델의 범주형 데이터 처리 방법과 관련이 있습니다. 이원분산분석에서 특정 변수들이 범주형 데이터로 취급되어야 하는 경우, C() 함수로 명시적으로 지정합니다. 이 함수는 범주형 변수를 처리할 때 데이터가 문자가 아니더라도 범주형으로 인식하도록 도와줍니다.

질문에서 물주기도 C()로 처리하는 이유는 다음과 같습니다:

  1. 범주형 변수로의 인식: 만약 물주기 변수가 수치형 데이터로만 입력되어 있지만, 실질적으로는 범주형(예: 물주기가 가질 수 있는 정해진 수의 그룹으로 처리 되어야 함)이라면 C()를 사용해야 정확한 결과를 얻을 수 있습니다. 예를 들어, 1일, 2일, 3일 간격의 물주기와 같은 일정한 단계가 있는 경우, 이를 범주형으로 인식하게 설정합니다.

  2. 상호작용 효과 고려: 이원분산분석(ANOVA)에서 주요 목표는 두 개 이상의 독립 변수가 종속 변수에 어떤 영향을 미치는지를 파악하는 것입니다. C(비료유형):C(물주기) 형태로 상호작용 효과를 포함하여 분석하면 두 변수의 조합이 종속 변수에 미치는 영향을 더 명확히 볼 수 있습니다. 완벽한 범주형 설정 없이 상호작용을 분석하면 잘못된 결과가 나올 수 있습니다.

  3. 결과 차이: 범주형 처리가 제대로 이뤄지지 않을 경우, 특정 변수가 카테고리로 작용하지 않고 단순 수치값으로 취급될 수 있으며, 이는 분산분석 결과에 영향을 미칠 수 있습니다. 따라서 예상과 다르게 변수를 설정하면 해석이 달라질 수 있습니다.

아래는 이와 관련한 유사 질문과 답변이 포스팅된 링크이니 참고하시기 바랍니다:

이 답변이 semistone6239님의 이해에 도움이 되길 바랍니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

작업형 1 배경지식 질문

0

2

1

옳게 풀은건지 질문드립니다!

0

3

0

roc_auc_score

0

5

1

추가질문 합니다

0

11

1

시험환경 구름

0

11

1

2유형 질문드려요

0

8

1

RandomForest vs lgb

0

18

1

전처리 관련질문

0

13

2

작업형3 기출

0

13

1

유형2에서 데이터분할 생략 가능여부

0

20

2

9회 기출 유형3 질문

0

15

1

lgb 기초편

0

10

1

괄호 사용

0

15

1

작업형 2 데이터 전처리 질문

0

19

1

11회 기출 유형 작업형1 문제 3-1

0

16

0

예시문제 작업형2 (ver2023) 질문입니다

0

16

1

Data type에 따른 처리

0

15

2

데이터 전처리 관련

0

16

2

시험에서 문제 불러오기

0

18

2

2번문제 출력값 질문

0

23

2

pd.get_dummies()가 bool로 반환

0

18

2

대응표본검정 레빈

0

23

3

단일표본검정 문제 유형

0

23

2

[작업형 3] 6~7. 카이제곱 검정

0

23

2