inflearn logo
강의

Course

Instructor

[Side Project After Work] Big Data Analysis Certification Practical Exam (Type 1, 2, 3)

Machine Learning Training and Evaluation (Regression)

작업형 2 제출방

3

rosana8831

2 asked

0

안녕하세요~

작업형 2 분류와 회귀 강의를 학습하는 도중 질문이 있습니다!
분류에서는

회귀에서는

분류 강의에서는 생성해 제출이라고 하셨고, 회귀 강의에서는 생성이라고 하셨는데 분류와 회귀 강의에서 한 작업에서 다른 점이 없는 거 같아서 질문드립니다. (데이터프레임 만들어서 제출하되 read로 행 개수 확인하기)

정확히 어떤 차이가 있는 걸까요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

Answer 1

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다.

rosana8831님의 질문은 작업형 2에서 분류와 회귀 문제의 결과물 제출 과정에서의 차이점에 대한 내용에 관한 것이군요. 강의 내용을 바탕으로 이해하기 어려운 부분이 있어 혼동을 느끼셨을 수 있습니다.

  1. 분류와 회귀의 공통점:

    • 두 유형 모두에서 최종적으로 result.csv를 생성하여 예측 결과를 제출하시는 점은 동일합니다.
    • result.csv 파일은 각각 예측된 결과만 포함하며, 컬럼명은 pred로 설정됩니다.
  2. 분류와 회귀의 차이점:

    • 예측값의 형태:
      • 분류의 경우: 결과값은 보통 0과 1처럼 이산적인 범주형 데이터입니다. model.predict 또는 확률값을 사용하는 경우(model.predict_proba)에서 결정된 값을 저장하여 제출합니다.
      • 회귀의 경우: 결과값은 연속적인 수치형 데이터입니다. 예를 들어, 임의의 부동 소수점 숫자가 될 수 있는 값으로 model.predict를 통해 나온 값들을 제출합니다.
  3. 제출 파일 생성과 확인:

    • 파일 생성: pd.DataFrame({'pred': 예측값}).to_csv('result.csv', index=False)를 통해 파일을 생성합니다.
    • 파일 확인: pd.read_csv('result.csv')를 통해 저장된 파일의 데이터를 확인하여 올바른 형식으로 저장되었는지를 체크합니다.

큰 차이점은 “결과값의 유형”이므로 로직 상으로는 매우 유사하게 보일 수 있습니다. 이 과정에 차이가 있다고 하기보다는, 제출하는 데이터의 성격이 다르다고 이해하시면 됩니다. 분류에서는 범주형 예측값, 회귀에서는 연속형 숫자값이 주어진다는 것이 핵심적인 차이입니다.

유사한 질문에서 더 구체적인 내용을 확인할 수 있으며, 유예빈님의 질문에 대해서도 작업형 2의 csv 제출 과정에 대한 설명이 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

인코딩 스케일링 순서

0

5

2

실제 시험에서도 공식을 문제에서 주는지

0

5

2

수강 연장 문의

0

7

2

작업형2 정리한 내용 확인 부탁드립니다 ㅜㅜ

0

12

1

14강 "" 사용 관련 질문

0

12

2

캐글 제출 점수

0

17

2

기출 마무리 방법

0

37

2

빅이시 작업형2 기초 - 케이스 1~3 관련 문의

0

24

2

데이터프레임 슬라이싱 인덱싱 질문2

0

24

2

단일표본검정, 샤피로검정, 윌콕슨검정

0

30

2

강의자료 다운로드 여부

0

30

2

문제에 첨부된 예시와 실제 출력된 샘플 비교

0

27

2

원핫 인코딩 관련

0

37

2

타겟 분리

0

37

2

Id 삭제

0

41

2

roc_auc_score 질문: 작업형2 모의문제3 09분 48초

0

37

2

원핫인코딩 코드 질문

0

35

2

map 함수 사용 필수적인가요

0

46

2

수강 기한 연장 문의드립니다.

0

50

2

34강 평가지표

0

36

2

103강 작업2형 전처리(레이블인코딩 부분) 오류

0

26

3

작업형1_section14 문의

0

23

2

작업형1_연습문제 7번 관련입니다.

0

28

2

데이터 프레임 슬라이싱 혹은 데이터 선택하기가 어렵습니다.

0

27

2