inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 파이썬 머신러닝 완벽 가이드

평가지표와 피쳐, 정확도

해결된 질문

220

예찬

작성한 질문수 30

0

1. "정확도 평가 지표는 불균형한 레이블 데이터 세트에서는 성능 수치로 사용되서는 안된다" 라고 책 150 페이지에 나와있는데 "불균형한 레이블 데이터 세트"에는 이진분류만 해당하는건가요?
 
2. 평가지표는 레이블 값의 여부로만 따져서 평가하나요? 예를 들어 피처값이 불균형한 데이터로, 레이블 값이 불균형한 데이터가 아닐 경우로 되어 있다면 정확도로 평가를 해도 문제가 없는건가요? 평가는 오로지 레이블 데이터 값의 여부에 따지는 것인지 궁금합니다!

통계 python 머신러닝 배워볼래요?

답변 1

0

권 철민

안녕하십니까, 

1.  여러개의 클래스를 가진 경우에도 적용될 수 있습니다. 예를 들어 A:10, B:1000, C:1000

하지만 많은 경우 이진 분류에서 정확도를 불균일한 데이터 세트의 평가지표로 적용하지 않습니다. 

 

2.  특정 잣대로 딱 정하실 필요는 없습니다. 정확도 평가 지표가 이런 문제점을 가지고 있으니까, 정확도 지표를 적용할 때 반드시 주의해야 한다는 것입니다.  평가를 레이블값의 여부를 가지고 따지실 필요는 없어 보입니다. 

0

예찬

정확도는 불균형한 데이터 일 때 사용하면  안되는데 불균형한 데이터라는게  레이블값의 여부뿐아니라 피처값(이진분류인 피처) 데이터 여부까지 중요할 수 있다는 건가요? 그렇다면 어떤 평가를 내려야 하는지 결정할 때 중요하게 고려해야 하는 부분이 어떤 요소들이 있을 수 있는지 궁금합니다

0

권 철민

여기서 언급드리는 불균형한 데이터는 레이블 값만 의미하는 것입니다

0

예찬

그럼 정확도의 불균형한 데이터가 안된다는게 레이블 값만 해당이 된다는건가요? 위의 답변에서 평가를 레이블 값의 여부를 가지고 따질 필요가 없다는 것은 어떤 뜻인가요?

0

권 철민

그럼 정확도의 불균형한 데이터가 안된다는게 레이블 값만 해당이 된다는건가요?

=> 네 맞습니다. 

위의 답변에서 평가를 레이블 값의 여부를 가지고 따질 필요가 없다는 것은 어떤 뜻인가요?

=> 위에서 질문하신 "평가는 오로지 레이블 데이터 값의 여부에 따지는 것인지 궁금합니다! " 의 답변입니다. 

특정 잣대로 딱 정하실 필요는 없습니다.

불균형하다는게 30:70 인지, 20:80인지 40:60인지 기준을 정할 수 없으며, 또한 정확도를 사용하지 말라는 누가 정해놓은 규칙이 있는것도 아닙니다. 

정확도 평가 지표가 이런 문제점을 가지고 있으니까, 정확도 지표를 적용할 때 반드시 주의해야 한다는 것이며, 이러한 문제점으로 인하여 일반적으로 불균형한 데이터 세트에서 정확도를 잘 사용하지 않는 다는 것입니다. 

 

0

예찬

아하 감사합니다 !!

모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.

0

56

2

안녕하세요 열심히 수강중인 학생입니다

0

93

2

정수 인덱싱

0

86

2

넘파이 오류

0

115

2

11강 numpy의 axis 축 질문 드립니다.

0

109

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

98

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

81

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

83

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

75

2

5강 강의 오류가 있어요.

0

90

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

81

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

79

3

파이썬 다운그레이 후 사이킷런 재설치

0

131

2

좋은 강의 감사합니다.

0

82

2

scoring 함수 음수값

0

75

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

108

2

분류 평가 정확도 예측

0

90

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

114

1

카카오톡 채널 있나요

0

119

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

195

2

pca 스케일링 관련하여 질문드립니다.

0

109

2

주피터 대신 구글 코랩

0

184

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

156

2

실루엣 스코어..

0

93

2