inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제1

머신러닝 순서 질문 드립니다.

해결된 질문

113

강민균

작성한 질문수 29

0

학습 커리큘럼에는

  1. 데이터불러오기, EDA

  2. 전처리

  3. 피처엔지니어링

  4. 모델링/평가(분류/회귀)

  5. 평가지표

     

     

    머신러닝파트에서 정리하신 순서는

  1. 불러오기

  2. EDA

  3. 전처리

  4. 피처엔지니어링

  5. 검증데이터분리

  6. 모델학습,평가 등

  7. 예측

  8. CSV파일 생성

이렇게 구성되었습니다.

커리큘럼과 학습정리 순서가 왜 다른지?

그럼 둘 중 뭐가 맞는가요?

 

커리큘럼 작업형2의 모의고사1 에서 머신러닝 풀다보면

불러오기-EDA-전처리-피처엔지니어링-검증데이터분리-모델학습,평가까지만 나가고 이 후 예측 부분을 작업하진 않으신 것 같습니다. 맞는지 확인 바랍니다.

설명이 프로세스대로 구분되지 않고 실습 형태로 위 아래 왔다 갔다 전개되어 단계별 경계를 구분할 수 없습니다.

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

머신러닝 프로세스 부분에서 다음과 같이 설명하고있어요

개념적으로는 아래 순서대로 진행되지만, 실습에서는 필요에 따라 일부 과정이 생략되거나 순서가 조정될 수 있습니다.

"모델링/평가(분류/회귀)"에서 검증 데이터 분리 - 모델 학습/평가 - 예측 등을 포함할 수 있습니다.

image.png

 

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. 강민균님.

머신러닝 프로젝트의 일반적인 순서에 대한 혼란이 있으시군요. 머신러닝 프로젝트의 진행 순서는 강의 제작자의 스타일이나 강의 목적에 따라 다를 수 있지만, 일반적인 지도학습 모델의 작업 흐름은 다음과 같습니다:

  1. 데이터 불러오기 및 EDA(탐색적 데이터 분석): 이는 데이터의 기본적인 통계와 특성을 이해하기 위해 중요한 단계입니다.

  2. 전처리 및 피처 엔지니어링: 데이터 정제, 결측치 처리, 인코딩 및 스케일링과 같은 데이터 전처리 및 피처 엔지니어링이 이 단계에서 이루어집니다.

  3. 검증 데이터 분리: 학습 데이터와 검증 데이터를 분리하여 모델의 성능을 객관적으로 평가할 수 있습니다.

  4. 모델 학습 및 평가: 여러 모델을 학습시키고, 성능을 평가하여 최적의 모델을 선택합니다.

  5. 예측 및 파일 생성: 최종적으로 테스트 데이터에 대해 예측을 수행하고, 결과를 CSV 파일 등으로 저장합니다.

강의에서는 이러한 단계를 실습 과정에서 다소 융통성 있게 진행할 수 있습니다. 제공된 커리큘럼과 강의의 실습 순서가 다를 수 있지만, 이는 학습 효과를 고려한 설계일 수 있어요. 중요한 점은 각 단계의 목적과 방법을 이해하는 것입니다.

관련해서 구체적인 질문과 답변을 확인하고 싶으시다면 다음 링크를 참고해주세요:

이 외에 추가적인 궁금증이 있다면 언제든지 이어서 질문해주세요. 지식공유자님께서 곧 답변해주실 것입니다. 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

14강 "" 사용 관련 질문

0

9

2

캐글 제출 점수

0

14

2

기출 마무리 방법

0

33

2

빅이시 작업형2 기초 - 케이스 1~3 관련 문의

0

22

2

데이터프레임 슬라이싱 인덱싱 질문2

0

22

2

단일표본검정, 샤피로검정, 윌콕슨검정

0

28

2

강의자료 다운로드 여부

0

30

2

문제에 첨부된 예시와 실제 출력된 샘플 비교

0

26

2

원핫 인코딩 관련

0

35

2

타겟 분리

0

30

2

Id 삭제

0

38

2

roc_auc_score 질문: 작업형2 모의문제3 09분 48초

0

37

2

원핫인코딩 코드 질문

0

33

2

map 함수 사용 필수적인가요

0

45

2

수강 기한 연장 문의드립니다.

0

44

2

34강 평가지표

0

35

2

103강 작업2형 전처리(레이블인코딩 부분) 오류

0

26

3

작업형1_section14 문의

0

23

2

작업형1_연습문제 7번 관련입니다.

0

27

2

데이터 프레임 슬라이싱 혹은 데이터 선택하기가 어렵습니다.

0

26

2

크로스 밸리데이션 질문

0

33

2

로지스틱 회귀분석 질문

0

32

2

수치형 데이터만 선택하여 푸는 경우에 오답확률이 높아질까요?

0

32

2

2유형 object 컬럼 인코딩 관련 질문

0

48

2