강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

강민균님의 프로필 이미지
강민균

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제1

머신러닝 순서 질문 드립니다.

해결된 질문

작성

·

70

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

학습 커리큘럼에는

  1. 데이터불러오기, EDA

  2. 전처리

  3. 피처엔지니어링

  4. 모델링/평가(분류/회귀)

  5. 평가지표

     

     

    머신러닝파트에서 정리하신 순서는

  1. 불러오기

  2. EDA

  3. 전처리

  4. 피처엔지니어링

  5. 검증데이터분리

  6. 모델학습,평가 등

  7. 예측

  8. CSV파일 생성

이렇게 구성되었습니다.

커리큘럼과 학습정리 순서가 왜 다른지?

그럼 둘 중 뭐가 맞는가요?

 

커리큘럼 작업형2의 모의고사1 에서 머신러닝 풀다보면

불러오기-EDA-전처리-피처엔지니어링-검증데이터분리-모델학습,평가까지만 나가고 이 후 예측 부분을 작업하진 않으신 것 같습니다. 맞는지 확인 바랍니다.

설명이 프로세스대로 구분되지 않고 실습 형태로 위 아래 왔다 갔다 전개되어 단계별 경계를 구분할 수 없습니다.

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

머신러닝 프로세스 부분에서 다음과 같이 설명하고있어요

개념적으로는 아래 순서대로 진행되지만, 실습에서는 필요에 따라 일부 과정이 생략되거나 순서가 조정될 수 있습니다.

"모델링/평가(분류/회귀)"에서 검증 데이터 분리 - 모델 학습/평가 - 예측 등을 포함할 수 있습니다.

image.png

 

0

안녕하세요, 인프런 AI 인턴입니다. 강민균님.

머신러닝 프로젝트의 일반적인 순서에 대한 혼란이 있으시군요. 머신러닝 프로젝트의 진행 순서는 강의 제작자의 스타일이나 강의 목적에 따라 다를 수 있지만, 일반적인 지도학습 모델의 작업 흐름은 다음과 같습니다:

  1. 데이터 불러오기 및 EDA(탐색적 데이터 분석): 이는 데이터의 기본적인 통계와 특성을 이해하기 위해 중요한 단계입니다.

  2. 전처리 및 피처 엔지니어링: 데이터 정제, 결측치 처리, 인코딩 및 스케일링과 같은 데이터 전처리 및 피처 엔지니어링이 이 단계에서 이루어집니다.

  3. 검증 데이터 분리: 학습 데이터와 검증 데이터를 분리하여 모델의 성능을 객관적으로 평가할 수 있습니다.

  4. 모델 학습 및 평가: 여러 모델을 학습시키고, 성능을 평가하여 최적의 모델을 선택합니다.

  5. 예측 및 파일 생성: 최종적으로 테스트 데이터에 대해 예측을 수행하고, 결과를 CSV 파일 등으로 저장합니다.

강의에서는 이러한 단계를 실습 과정에서 다소 융통성 있게 진행할 수 있습니다. 제공된 커리큘럼과 강의의 실습 순서가 다를 수 있지만, 이는 학습 효과를 고려한 설계일 수 있어요. 중요한 점은 각 단계의 목적과 방법을 이해하는 것입니다.

관련해서 구체적인 질문과 답변을 확인하고 싶으시다면 다음 링크를 참고해주세요:

이 외에 추가적인 궁금증이 있다면 언제든지 이어서 질문해주세요. 지식공유자님께서 곧 답변해주실 것입니다. 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

강민균님의 프로필 이미지
강민균

작성한 질문수

질문하기