inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[자주묻는질문] sum과 len

statsmodel.formula.api.ols와 sklearn.linear_model.LinearRegression의 차이

해결된 질문

456

ookim

작성한 질문수 3

0

선형회귀분석에서 statsmodel.formula.api.ols와 sklearn.linear_model.LinearRegression의 차이가 궁금합니다.

 

어떨 때 ols를 쓰고, 어떨때 LinearRegression을 쓰는지 구분이 잘 안돼요.

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

강의에서

작업형2에서는 LinearRegression를 사용하고

작업형3에서는 ols를 사용하고 있어요

작업형3에서도 LinearRegression를 사용할 수는 있지만 문제에 따라 풀 수 없는 문제가 있어요!

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

ookim님께서 질문하신 statsmodel.formula.api.olssklearn.linear_model.LinearRegression의 차이에 대해 궁금하신 것으로 보입니다. 이 두 함수는 선형회귀분석을 수행할 때 사용되지만, 몇 가지 중요한 차이점이 있습니다.

  1. statsmodels.formula.api.ols:

    • statsmodels 라이브러리의 함수로, 주로 통계 분석과 동시에 결과 해석에 초점을 맞추어 사용됩니다.
    • R 스타일의 모델 수식을 사용할 수 있으며, 모델의 요약결과(summary)에서 통계적 지표(예: p-value, R-squared 등)를 쉽게 볼 수 있다는 장점이 있습니다.
    • 요약 결과는 모델의 성능 평가 및 변수의 유의성 검정에 유용하게 사용됩니다.
  2. sklearn.linear_model.LinearRegression:

    • scikit-learn 라이브러리의 함수로, 머신러닝에 초점을 맞춘 라이브러리입니다.
    • 학습을 수행한 후 예측값을 얻기 위한 목적으로 사용되는 경우가 많으며, 대규모 데이터에 대한 모델 학습 및 예측에 최적화되어 있습니다.
    • scikit-learn은 교차 검증 같은 머신러닝의 편의 기능을 제공하며, 모델의 성능을 측정하기 위해 다양한 메트릭스(metrics)를 제공합니다.

질문하신 맥락과 유사한 답변은 “다중회귀” 에서 자세히 다루고 있습니다. 해당 게시글에서는 다중 선형 회귀 모형을 구현할 때 statsmodelsscikit-learn을 어떻게 사용하는지, 그리고 각각의 특징에 대해 설명하고 있습니다.

요약하자면, statsmodels는 통계 분석과 세밀한 결과 해석이 필요할 때, scikit-learn은 모델의 예측 성능 최적화와 교차 검증, 대규모 데이터 처리가 필요할 때 각각 선호되며 사용됩니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

3번문제 등분산 가정

0

4

1

작업형3 target 형 변환 질문

0

3

1

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

4

1

원핫인코딩과 레이블 인코딩에서 concat

0

20

2

제2유형 질문입니다.

0

25

2

C()

0

23

2

작업형 2에서 strafity 적용 유무

0

28

2

수강 기간 연장 가능 여부 문의드립니다.

0

27

1

ols

0

26

2

2유형 작성관련 질문(일반 심화)

0

23

2

2유형 작성관련 질문

0

21

2

2유형 object컬럼 개수 다르면

0

25

2

코딩팡질문이요ㅠㅠ

0

23

2

관찰값과 기대값의 개념이 헷갈립니다.

0

13

2

작업형2 ID 컬럼 삭제 질문

0

23

2

2유형 작성관련 질문

0

21

2

memoryerror 질문

0

18

2

작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?

0

23

1

ID 삭제 필수 인가요?

0

21

3

7회 기출문제 작업형1번 df 변환 후 저장되는 방식 질문

0

20

2

3 유형 귀무가설, 대립가설

0

22

2

인코딩 관련 질문 있습니다

0

26

2

작업형3 이원분산분석 sm에서불러오기 / anova_lm 차이

0

32

2

2유형 원핫인코딩 오류

0

24

2