inflearn logo
강의

Khóa học

Chia sẻ kiến thức

[Làm gì sau giờ làm] Chứng chỉ Phân tích Dữ liệu lớn - Kỳ thi thực hành (Dạng bài tập 1, 2, 3)

Phân tích biến lượng đơn yếu tố

C()

3

nine141417329586

3 câu hỏi đã được viết

0

회귀와 로지스틱 회귀 문제에서 데이터가 숫자이지만 범주형 변수라고 지정할 때에만 C()를 붙여야 한다고 하셨는데

 

"일원분산분석"과 "이원분산분석"에서는 ols()에서 모든 독립변수에 C()를 붙여도 되는 것이 맞나요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

Câu trả lời 1

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. 토우마님께서 질문해주신 내용에 대해 설명드리겠습니다.

분산분석과 회귀 분석에서 C() 함수의 사용에 대해 혼란스러우실 수 있습니다. C() 함수는 범주형 데이터를 명시적으로 지정하기 위해 사용됩니다. 특정 상황에서는 사용법이 달라질 수 있습니다:

  1. 일원/이원 분산분석: 이 상황에서는 모든 독립변수가 범주형으로 해석됩니다. 따라서 ols() 함수에서 모든 독립변수 앞에 C()를 붙이는 것이 일반적입니다. 이는 변수가 실제로 수치형으로 보일 수 있지만, 그 변수를 범주형으로 취급해야 하는 경우에 특히 필요합니다.

  2. 회귀 및 로지스틱 회귀 분석: 경우에 따라 다릅니다. 여기서는 범주형 변수를 명시적으로 나타내기 위해 C()를 사용하는데, 만약 데이터가 숫자지만 범주형으로 해석되어야 한다면 숫자에서 범주형으로 명확히 구분이 필요할 때 C()를 사용하여 이를 처리합니다. 모든 변수에 무작정 C()를 사용하는 것은 올바르지 않습니다.

더 깊이 있는 이해를 위해 유용한 추가 자료를 참고하실 수 있습니다:
- 회귀분석에서의 C() 사용법
- 분산분석에서 C(변수)의 활용

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

작업형 2에서 strafity 적용 유무

0

7

2

수강 기간 연장 가능 여부 문의드립니다.

0

9

1

ols

0

10

2

2유형 작성관련 질문(일반 심화)

0

14

2

2유형 작성관련 질문

0

11

2

2유형 object컬럼 개수 다르면

0

14

2

코딩팡질문이요ㅠㅠ

0

14

2

관찰값과 기대값의 개념이 헷갈립니다.

0

12

2

작업형2 ID 컬럼 삭제 질문

0

21

2

2유형 작성관련 질문

0

15

2

memoryerror 질문

0

14

2

작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?

0

15

1

ID 삭제 필수 인가요?

0

18

3

7회 기출문제 작업형1번 df 변환 후 저장되는 방식 질문

0

15

2

3 유형 귀무가설, 대립가설

0

19

2

인코딩 관련 질문 있습니다

0

22

2

작업형3 이원분산분석 sm에서불러오기 / anova_lm 차이

0

21

2

2유형 원핫인코딩 오류

0

22

2

시험장에서 주석 단축키 안될 때 많나요?

0

27

2

라벨인코딩 방식

0

25

2

test 재학습 관련

0

16

2

target 빈도 확인

0

18

2

작업형 2 연습문제 섹션 6

0

20

2

F1-score

0

19

2