inflearn logo
강의

Khóa học

Chia sẻ kiến thức

[Làm gì sau giờ làm] Chứng chỉ Phân tích Dữ liệu lớn - Kỳ thi thực hành (Dạng bài tập 1, 2, 3)

Đề thi mẫu lần thứ 10 (Dạng thực hành 3)

로지스틱회귀, 회귀

1

rosana8831

13 câu hỏi đã được viết

0

 

기출 풀어보면 C를 안 붙이고, object도 자연스럽게 변환된다고 하셨는데, 연습할 때 gender에 C를 붙였던 경험이 있습니다.

 

혹시 언제 붙이고 언제 안 붙이는지 알 수 있을까욤..?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

Câu trả lời 1

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. rosana8831님께서 질문해주신 내용에 대해 설명드리겠습니다.

회귀 분석이나 로지스틱 회귀 분석에서는 범주형 변수를 모델에 포함할 때, Python의 statsmodels 라이브러리에서는 C() 함수를 사용하여 해당 변수가 범주형임을 명시할 수 있습니다. C()를 사용할지 말지는 다음과 같은 기준을 고려하시면 됩니다:

  1. 변수가 문자로 된 경우: statsmodels은 자동으로 문자형 변수를 범주형으로 처리해줍니다. 이 경우 C()를 사용하지 않아도 되는 경우가 많습니다.

  2. 변수가 숫자로 표현된 범주형인 경우: 자동으로 범주형 변수로 인식되지 않을 수 있어서, 이러한 경우에는 C()를 사용하는 것이 정확한 분석을 위해 필요합니다. 예를 들어, 숫자로 명시된 클래스 정보 등이 있습니다.

  3. 문제의 요구 사항: 강의나 실습에서도 언급되었듯이 문제 내에서 특정 변수가 범주형으로 처리되어야 함이 명시되어 있으면, C()의 사용을 통해 명확하게 범주형으로 처리되도록 해야 합니다.

관련 질문에 대한 유사한 답변을 아래에서 확인하실 수 있습니다:

이 답변이 도움이 되었기를 바라며, 만족스러운 답변을 제공해 드리기 위해 지식공유자님의 기존 답변을 참고하여 추천 링크를 드리고 있습니다. 현재 베타 기능 단계에 있어, 답변이 완벽하지 않을 수 있는 점 양해 부탁드립니다. 🙏 궁금한 점이 있으시면 언제든지 추가 질문해 주세요. 곧 지식공유자께서 더 상세히 답변해 주실 것입니다.

회귀 문제를 풀때 질문입니다.

0

13

1

불균형 처리 후 성능이 더 낮아졌다면,

0

25

2

실기 체험 제2유형 에러 문의

0

26

1

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

0

20

2

3번문제 등분산 가정

0

27

2

작업형3 target 형 변환 질문

0

25

2

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

19

3

원핫인코딩과 레이블 인코딩에서 concat

0

34

2

제2유형 질문입니다.

0

37

2

C()

0

34

2

작업형 2에서 strafity 적용 유무

0

36

2

수강 기간 연장 가능 여부 문의드립니다.

0

40

1

ols

0

32

2

2유형 작성관련 질문(일반 심화)

0

27

2

2유형 작성관련 질문

0

25

2

2유형 object컬럼 개수 다르면

0

33

2

코딩팡질문이요ㅠㅠ

0

33

2

관찰값과 기대값의 개념이 헷갈립니다.

0

17

2

작업형2 ID 컬럼 삭제 질문

0

33

2

2유형 작성관련 질문

0

23

2

memoryerror 질문

0

19

2

작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?

0

33

1

ID 삭제 필수 인가요?

0

31

3

7회 기출문제 작업형1번 df 변환 후 저장되는 방식 질문

0

26

2