머신러닝 순서 질문 드립니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
학습 커리큘럼에는
데이터불러오기, EDA
전처리
피처엔지니어링
모델링/평가(분류/회귀)
평가지표
머신러닝파트에서 정리하신 순서는
불러오기
EDA
전처리
피처엔지니어링
검증데이터분리
모델학습,평가 등
예측
CSV파일 생성
이렇게 구성되었습니다.
커리큘럼과 학습정리 순서가 왜 다른지?
그럼 둘 중 뭐가 맞는가요?
커리큘럼 작업형2의 모의고사1 에서 머신러닝 풀다보면
불러오기-EDA-전처리-피처엔지니어링-검증데이터분리-모델학습,평가까지만 나가고 이 후 예측 부분을 작업하진 않으신 것 같습니다. 맞는지 확인 바랍니다.
설명이 프로세스대로 구분되지 않고 실습 형태로 위 아래 왔다 갔다 전개되어 단계별 경계를 구분할 수 없습니다.
답변 2
0
머신러닝 프로세스 부분에서 다음과 같이 설명하고있어요
개념적으로는 아래 순서대로 진행되지만, 실습에서는 필요에 따라 일부 과정이 생략되거나 순서가 조정될 수 있습니다.
"모델링/평가(분류/회귀)"에서 검증 데이터 분리 - 모델 학습/평가 - 예측 등을 포함할 수 있습니다.

0
안녕하세요, 인프런 AI 인턴입니다. 강민균님.
머신러닝 프로젝트의 일반적인 순서에 대한 혼란이 있으시군요. 머신러닝 프로젝트의 진행 순서는 강의 제작자의 스타일이나 강의 목적에 따라 다를 수 있지만, 일반적인 지도학습 모델의 작업 흐름은 다음과 같습니다:
데이터 불러오기 및 EDA(탐색적 데이터 분석): 이는 데이터의 기본적인 통계와 특성을 이해하기 위해 중요한 단계입니다.
전처리 및 피처 엔지니어링: 데이터 정제, 결측치 처리, 인코딩 및 스케일링과 같은 데이터 전처리 및 피처 엔지니어링이 이 단계에서 이루어집니다.
검증 데이터 분리: 학습 데이터와 검증 데이터를 분리하여 모델의 성능을 객관적으로 평가할 수 있습니다.
모델 학습 및 평가: 여러 모델을 학습시키고, 성능을 평가하여 최적의 모델을 선택합니다.
예측 및 파일 생성: 최종적으로 테스트 데이터에 대해 예측을 수행하고, 결과를 CSV 파일 등으로 저장합니다.
강의에서는 이러한 단계를 실습 과정에서 다소 융통성 있게 진행할 수 있습니다. 제공된 커리큘럼과 강의의 실습 순서가 다를 수 있지만, 이는 학습 효과를 고려한 설계일 수 있어요. 중요한 점은 각 단계의 목적과 방법을 이해하는 것입니다.
관련해서 구체적인 질문과 답변을 확인하고 싶으시다면 다음 링크를 참고해주세요:
- 기출 6회 작업형 2 - 검증 데이터 분리와 모델 평가에 관한 질문
- 4회 작업형 2번 풀이 질문 - 머신러닝 모델링 전체 과정에 대한 실무적 팁
이 외에 추가적인 궁금증이 있다면 언제든지 이어서 질문해주세요. 지식공유자님께서 곧 답변해주실 것입니다. 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
14강 "" 사용 관련 질문
0
9
2
캐글 제출 점수
0
14
2
기출 마무리 방법
0
33
2
빅이시 작업형2 기초 - 케이스 1~3 관련 문의
0
22
2
데이터프레임 슬라이싱 인덱싱 질문2
0
22
2
단일표본검정, 샤피로검정, 윌콕슨검정
0
28
2
강의자료 다운로드 여부
0
30
2
문제에 첨부된 예시와 실제 출력된 샘플 비교
0
26
2
원핫 인코딩 관련
0
35
2
타겟 분리
0
30
2
Id 삭제
0
38
2
roc_auc_score 질문: 작업형2 모의문제3 09분 48초
0
37
2
원핫인코딩 코드 질문
0
33
2
map 함수 사용 필수적인가요
0
45
2
수강 기한 연장 문의드립니다.
0
44
2
34강 평가지표
0
35
2
103강 작업2형 전처리(레이블인코딩 부분) 오류
0
26
3
작업형1_section14 문의
0
23
2
작업형1_연습문제 7번 관련입니다.
0
27
2
데이터 프레임 슬라이싱 혹은 데이터 선택하기가 어렵습니다.
0
26
2
크로스 밸리데이션 질문
0
33
2
로지스틱 회귀분석 질문
0
32
2
수치형 데이터만 선택하여 푸는 경우에 오답확률이 높아질까요?
0
32
2
2유형 object 컬럼 인코딩 관련 질문
0
48
2





