inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

10회 기출유형 (작업형3)

로지스틱회귀, 회귀

해결된 질문

46

rosana8831

작성한 질문수 13

0

 

기출 풀어보면 C를 안 붙이고, object도 자연스럽게 변환된다고 하셨는데, 연습할 때 gender에 C를 붙였던 경험이 있습니다.

 

혹시 언제 붙이고 언제 안 붙이는지 알 수 있을까욤..?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

1

퇴근후딴짓

분산 분석에서 독립변수는 붙이기입니다. 헷갈린 것 같아요


회귀 / 로지스틱 회귀는 사용 하면 안되요!!

  • 문제에서 숫자지만 범주형이란 명시가 있을때만 사용

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. rosana8831님께서 질문해주신 내용에 대해 설명드리겠습니다.

회귀 분석이나 로지스틱 회귀 분석에서는 범주형 변수를 모델에 포함할 때, Python의 statsmodels 라이브러리에서는 C() 함수를 사용하여 해당 변수가 범주형임을 명시할 수 있습니다. C()를 사용할지 말지는 다음과 같은 기준을 고려하시면 됩니다:

  1. 변수가 문자로 된 경우: statsmodels은 자동으로 문자형 변수를 범주형으로 처리해줍니다. 이 경우 C()를 사용하지 않아도 되는 경우가 많습니다.

  2. 변수가 숫자로 표현된 범주형인 경우: 자동으로 범주형 변수로 인식되지 않을 수 있어서, 이러한 경우에는 C()를 사용하는 것이 정확한 분석을 위해 필요합니다. 예를 들어, 숫자로 명시된 클래스 정보 등이 있습니다.

  3. 문제의 요구 사항: 강의나 실습에서도 언급되었듯이 문제 내에서 특정 변수가 범주형으로 처리되어야 함이 명시되어 있으면, C()의 사용을 통해 명확하게 범주형으로 처리되도록 해야 합니다.

관련 질문에 대한 유사한 답변을 아래에서 확인하실 수 있습니다:

이 답변이 도움이 되었기를 바라며, 만족스러운 답변을 제공해 드리기 위해 지식공유자님의 기존 답변을 참고하여 추천 링크를 드리고 있습니다. 현재 베타 기능 단계에 있어, 답변이 완벽하지 않을 수 있는 점 양해 부탁드립니다. 🙏 궁금한 점이 있으시면 언제든지 추가 질문해 주세요. 곧 지식공유자께서 더 상세히 답변해 주실 것입니다.

실기시험 제출관련

0

123

2

6.20 작업형 2 과적합

0

136

3

코딩팡 장업형2 베이스 라인 인코딩 종류 질문

0

38

2

회귀 문제를 풀때 질문입니다.

0

52

1

불균형 처리 후 성능이 더 낮아졌다면,

0

60

2

실기 체험 제2유형 에러 문의

0

60

1

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

0

46

2

3번문제 등분산 가정

0

46

2

작업형3 target 형 변환 질문

0

34

2

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

36

3

원핫인코딩과 레이블 인코딩에서 concat

0

56

2

제2유형 질문입니다.

0

46

2

C()

0

44

2

작업형 2에서 strafity 적용 유무

0

49

2

수강 기간 연장 가능 여부 문의드립니다.

0

57

1

ols

0

43

2

2유형 작성관련 질문(일반 심화)

0

38

2

2유형 작성관련 질문

0

39

2

2유형 object컬럼 개수 다르면

0

47

2

코딩팡질문이요ㅠㅠ

0

45

2

관찰값과 기대값의 개념이 헷갈립니다.

0

25

2

작업형2 ID 컬럼 삭제 질문

0

45

2

2유형 작성관련 질문

0

32

2

memoryerror 질문

0

30

2