inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

8회 기출유형(작업형3)

다중회귀와 다중선형회귀 공식

138

인옥

작성한 질문수 18

0

다중회귀와 다중선형회귀 공식이 틀린거죠?

 

다중회귀

import statsmodels.stats.api as sm

 

다중선형회귀

from statsmodels.formula. api import ols

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 3

1

퇴근후딴짓

제가 from statsmodels.formula. api import ols 로 사용한 것 같은데

import statsmodels.stats.api as sm로 사용한 영상이 있나요??

 

sm.OLS()도 ols()같은 회귀 모델입니다. 다만

ols()는 r 포뮬라 방식을 따르고 있고,

OLS()는 사용법은 머신러닝 방식과 유사하나

상수를 직접 넣어야하는 불편함이 있어요 sm.add_constant(X)

 

다중회귀 다중선형회귀로 구분하기보다 OLS()와 ols() 사용법 차이가 있어요

0

인옥

감사합니다. 저도 다시한번 해보겠습니다

0

인옥

다른 예시 문제를 풀다보니 그렇게 풀어야 풀이답이 나와서요

다중선형회귀분석이든 다중회귀이든 선생님이 알려주신대로

from statsmodels.formula.api import ols로 푸니까 문제집에 있는 답과 안맞아서요

회귀분석이라고 나오면 '선형' 이란 말 없어도 위에 공식으로 풀면 되나요?

로지스틱회귀모형도 from statsmodels.formula.api import

logit로만 풀면 다되는 줄 알았는데 제가 가지고 있는 문제집은 상수항 추가하는 것으로 풀어서 답이 일치가 안되네요 ㅜㅜㅜ 어떤것으로 해야할지요

상수항 추가는 번거롭다고 하셔서 그건 아예 외우지도 않았어요

0

퇴근후딴짓

동일한 함수이고 결과는 같아야 정상입니다. (미세한 소수 끝자리 차이 제외)

달랐다면 전처리에서 입력 데이터를 다르게 넣은 것은 아닐까요?

 

다른 도서에서 어떻게 설명하고 있는지는 모르겠지만 제가 설명한 방식으로 시험문제에서 이슈가 없었습니다.

 

0

퇴근후딴짓

두 코드를 코드블럭 활용해 보여주시겠어요?

image.png


 

0

퇴근후딴짓

혹시나 싶어 저도 체크해봤어요
시험환경에서 아래 코드 활용시 결과는 같습니다.

import pandas as pd
from statsmodels.formula.api import ols
import statsmodels.api as sm

# Titanic 데이터 로드
df = pd.read_csv("data/Titanic.csv")

# 필요한 데이터 전처리 (예: Null 값 처리)
df = df.dropna(subset=['Survived', 'Age', 'Fare', 'Pclass'])  # Null 값 제거

# 1. ols 사용 
formula_model = ols("Survived ~ Age + Fare + Pclass", data=df).fit()

# 2. OLS 사용
X = df[['Age', 'Fare', 'Pclass']]  
X = sm.add_constant(X)   
y = df['Survived']       

manual_model = sm.OLS(y, X).fit()

# 결과 비교
print("ols")
print(formula_model.summary())

print("sm.OLS")
print(manual_model.summary())

스크린샷 2024-11-22 오후 7.11.47.png.webp스크린샷 2024-11-22 오후 7.11.58.png.webp

 

 

 

질문 드립니다.

0

38

2

강의 내용 관련 질문드립니다~

0

35

2

수강 연장 문의

0

33

1

강의자료 일괄 다운로드

0

43

2

수강기간 연장 문의드립니다

0

29

1

list 문제 질문드립니다~

0

31

2

빅분기 실기 12회 재도전

0

40

1

강의 기간 연장 가능여부 검토 요청건

0

30

1

수강기간 연장 문의 드립니다

0

36

2

수강기간 연장 문의드립니다

0

47

2

질문이요

0

51

2

수강기간 연장 문의드립니다.

0

50

2

문제 3-2 질문드립니다

0

44

2

수강기간 연장 문의 드립니다.

0

58

2

변수, 칼럼 , df 구분

0

50

2

수강기간 연장 문의드립니다.

0

50

2

수강기간 연장 문의

0

48

2

수강기간 연장 문의드립니다.

0

42

2

수강기한 연장 문의

0

80

2

수강기간 연장 문의드립니다

0

57

2

결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유

0

45

2

수강기간 연장 문의드립니다.

0

71

2

수강연장 문의

0

77

2

수강연장문의

0

53

2