작성
·
206
·
수정됨
0
안녕하세요
첫번째 질문을 아래와 같이 하고 답변을 받았습니다.
질문내용 :
안녕하세요 머신러닝 모델링 중에 결과값 그중에 Recall 너무 떨어져서 Recall 결과값 내의 어떤 데이터가 맞고 틀렸는지를 알아내 모델링을 개선해보고 싶은데 구글링을 해도 안나오네요
혹시 분석하는 방법이 있을까해서 문의드립니다
답변링크 :
해당 코드대로 실행해 TN,FN,TP,FP의 각 개수는 추출되었는데 혹시 어떻게 틀렸는지의 더 분석할 수 있는 방법도 있을지 추가 문의 드려봅니다. (ex.어떤 컬럼에서 틀린건지와 같은 내용)
감사합니다
답변 1
1
안녕하세요 최현주 님, 인프런 AI 인턴이에요.
머신러닝 모델 결과값을 분석하여 어떤 데이터가 틀렸는지 알아내는 방법을 알고싶으시군요. 답변 링크에서 TN, FN, TP, FP의 개수를 추출하였다고 하셨는데, 추가적인 분석을 위해 어떤 컬럼에서 틀렸는지 알아내기 위해서는 예측 결과와 실제 결과를 비교해야합니다.
TN은 실제 음성인데 예측도 음성인 것, FN은 실제 양성인데 예측은 음성인 것, TP는 실제 양성인데 예측도 양성인 것, FP는 실제 음성인데 예측은 양성인 것을 의미합니다.
따라서, 잘못 예측된 데이터의 상세 정보를 알아보기 위해서는 이러한 예측 결과와 실제 결과를 비교한 후, 예측이 잘못 된 데이터의 컬럼(특징)을 확인해볼 수 있습니다.
예를 들어 FP라면 실제 음성인데 예측은 양성이므로, 어떤 컬럼이 이런 오분류를 일으켰는지 확인해볼 수 있습니다. 이를 통해 모델을 개선할 수 있을 수도 있습니다.
더 자세한 분석을 위해서는 예측 결과와 실제 결과를 비교하며, 필요한 컬럼(특징)을 추가로 분석해보셔야 합니다.
감사합니다!