강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

bonanza9312님의 프로필 이미지
bonanza9312

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[작업형3] 4~5 분산 분석

이원분산분석 범주형변수 C()처리

작성

·

20

0

전에 다른 질문에서, 범주형 변수는 C()를 처리하라고 하셨었고,

 

범주형 변수중에서도 숫자로 되어있는 (문제의 물주기 처럼) 경우에만 C()를 필수로 해야한다고 하시고,

 

문제에서 범주형 변수다! 라고 주어지지 않으면 C()를 쓰지 말라고 하셨는데요...

 

어떻게 해야할까요..!!!!!!

이번문제의 경우 아예 범주형변수라고 주어지지 않았으니 모든 변수에 C()를 빼고 할까요? 그럼 코랩의 답안과 달라지긴 하더라구요!

답변 3

0

bonanza9312님의 프로필 이미지
bonanza9312
질문자

확인감사합니다. 그럼 일원분산분석에서는 groups에 c()를 안하셨던데, 이유가 있을까요?

 

원래도 문자로 작성된거라 쓰나 안쓰나 차이가 없어서일까요?

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

groups을 C()로 했을 때와 안 했을 때 한번 확인해 주시겠어요?

 

어제 새소식으로 안내드리긴 했는데

https://inf.run/jSfia

문자면 자동으로 인코딩처리 됩니다.

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

분산 분석은 C()하는 것이 일반적입니다.

 

제가 하지 말라고 한것은 로지스틱회귀와 회귀입니다. 헷갈리면 안됩니다.

0

안녕하세요, 인프런 AI 인턴입니다. bonanza9312님께서 이원분산분석에서 범주형 변수 처리에 대한 질문을 해주셨습니다. 이와 관련해 기본적인 가이드를 제공해 드릴게요.

먼저, C() 함수는 범주형 변수를 명시적으로 지정하는 용도로 사용됩니다. 이는 데이터 분석의 정확성을 높이고, 모델이 각 데이터를 올바르게 해석할 수 있도록 돕는 역할을 합니다.

  1. 범주형 변수 처리:

    • 문자열 형식의 범주형 변수: 자동으로 범주형으로 인식되기 때문에 C()를 사용하지 않아도 됩니다.
    • 숫자로 코딩된 범주형 변수: C()를 사용해야 범주형으로 처리됩니다. 예를 들어, 1, 2, 3과 같은 숫자가 실제 범주를 나타내는 경우입니다.
  2. 문제에서 명시된 경우:

    • 문제에서 특정 변수를 범주형으로 명시한다면, 해당 변수에 C()를 추가하는 것이 좋습니다.
    • 문제에서 범주형 변수임을 명시하지 않았다면, 변수가 가지는 의미를 고려해 C()의 사용 여부를 결정하는 것이 중요합니다.
  3. 범주형 변수의 명시 없이 모든 변수에 C()를 사용하지 않는 것:

    • 범주형 변수임을 스스로 판단해야 하는 경우 아닙니다. 자동으로 잘못 처리될 수 있어 주의가 필요합니다.
    • C() 처리를 잘못할 경우 결과가 달라질 수 있으니, 코랩의 참고 답안과 비교하여 확인하는 것도 좋은 방법입니다.

추가적인 학습 자료:

위 링크를 참고하여 범주형 변수 처리에 대한 이해를 돕길 바랍니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

bonanza9312님의 프로필 이미지
bonanza9312

작성한 질문수

질문하기