inflearn logo
강의

Khóa học

Chia sẻ kiến thức

[Làm gì sau giờ làm] Chứng chỉ Phân tích Dữ liệu lớn - Kỳ thi thực hành (Dạng bài tập 1, 2, 3)

Chỉ số đánh giá (Phân loại nhị phân/đa lớp, Hồi quy)

34강 평가지표

15

gogostst439460

1 câu hỏi đã được viết

0

안녕하세요 강사님

평가지표 강의중에 문득 궁금한게 생겨서요

앞선 강의에서는 문자는 모두 인코딩을 통해 숫자형으로 변환했는데,

갑가지 강의에서 실제값, 예측값에 문자가 있을 경우를 설명해주시니 조금 혼란스럽네요...

그리고 이번 강의는 너무 빠르게 훑고 넘어가서 이해가 잘 안되는거 같습니다

아래 average 부분도 언제 이걸 쓰는지 알아야 할 거 같은데... 설명없이 슥 넘어가버려서...

average= micro, macro, weighted

python 머신러닝 빅데이터 pandas 빅데이터분석기사

Câu trả lời 2

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. 아아님!

빅데이터 분석 및 머신러닝 과정에서는 데이터의 전처리가 기본적으로 중요합니다. 그 중에서도 문자열 데이터는 학습에 방해가 될 수 있어 보통은 숫자로 인코딩하여 처리합니다. 다만, 강의에서 문자를 그대로 사용하는 경우가 언급된 이유는, 실제 데이터에 문자형 데이터가 존재할 때의 불확실성을 이해하기 위함이나, 평가 지표를 설명하는 맥락에서 다루어졌을 가능성이 있습니다.

평가지표에서 average 파라미터는 다중 클래스(target이 여러 범주로 이루어진) 문제에 대한 평가 방법을 정의합니다:

  1. micro: 모든 클래스의 개별 성능을 통합하여 전반적인 평가를 진행하는 방식입니다. 각 클래스의 경우 수가 많아도 전체 데이터를 기반으로 평가하여 빠르게 평가하고자 할 때 유용합니다.

  2. macro: 각 클래스의 지표를 개별적으로 계산하고 평균을 내는 방식입니다. 이는 모든 클래스에 동등한 비중을 두어 평가하기 때문에 특정 클래스가 다른 클래스보다 중요하게 다뤄질 수 없으며, 각 클래스별로 성과를 강조하고 싶을 때 사용합니다.

  3. weighted: 각 클래스의 비중에 따라 가중값을 부여하여 평균을 계산하는 방식입니다. 이는 클래스 간의 균형이 고려되므로 클래스 불균형 문제를 보완하는 데 유용합니다.

평가지표를 효과적으로 이해하기 위해선, 사용하는 데이터의 유형과 각 클래스의 목표에 따라 적절한 average 방식을 선택하는 것이 중요합니다. 문제의 성격에 따라 어떤 평균 방법을 사용할지 결정하는 것이 분석 과정의 키 포인트입니다.

아래는 관련된 유사 질문 및 문제를 더 깊이 이해할 수 있는 참고 링크입니다:
- 평가지표 F1 스코어 질문드립니다.: F1 스코어와 각 average 옵션의 사용법에 대해 설명합니다.
- 4회 기출 유형(작업형2) 관련 질문: 각 average 옵션 사용 시 주의점이 설명된 게시물입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

0

roadmap

안녕하세요!

시험을 목표로 하다보니 다소 복잡한 각 지표를 자세히 설명하기 보다

이런 분류와 회귀에는 이런 평가 지표가 있다!! 워딩을 설명한 것이라고 봐주세요!

그리고 이 함수를 이렇게 불러와서 쓴다! 까지면 충분합니다.


예를 들어,

average= micro, macro, weighted

는 문제에서 f1 micro 로 계산하시오! 라고 나옵니다.

그럼 average= micro 를 f1함수에 파라미터로 넣어주면 됩니다.


103강 작업2형 전처리(레이블인코딩 부분) 오류

0

8

2

작업형1_section14 문의

0

8

2

작업형1_연습문제 7번 관련입니다.

0

10

2

데이터 프레임 슬라이싱 혹은 데이터 선택하기가 어렵습니다.

0

10

2

크로스 밸리데이션 질문

0

14

2

로지스틱 회귀분석 질문

0

14

2

수치형 데이터만 선택하여 푸는 경우에 오답확률이 높아질까요?

0

23

2

2유형 object 컬럼 인코딩 관련 질문

0

32

2

하이퍼파라미터 변수

0

29

2

52강 이원분산분석

0

26

2

실제시험환경에서 작업형1,2,3의 문제풀이 순서

0

31

2

독립표본검정

0

25

2

tranform을 쓰라는 힌트는 어디서 얻을 수 있나요??

0

36

2

df.describe() 사용을 자제해야할까요?

0

35

2

shape 결과에 대한 문의

0

37

2

자료 문의

0

31

2

8 회귀 11번

0

27

2

심화 강의 관련 질문

0

36

2

빈도수 구하는 것 질문

0

26

2

커리큘럼을 따로 인쇄할 수 있는 방법이 있을까요?

0

38

1

작업형2 머신러닝 문제풀이 중 test 데이터 에러 문의

0

34

2

수강연장가능문의

0

45

2

59. 11회 기출 유형 작업형 1 - 문제2 관련

0

37

2

원핫인코딩 슬라이싱 결과

0

33

2