팩터형 변수가 많을 경우
230
작성한 질문수 2
안녕하세요 작업형2 예제 문제에서 주구매상품이랑 주구매지점의 경우 팩터형 변수로 지우고 분석해도 모델성능에 큰 차이는 없다라고 하셨습니다.
혹시 다른 데이터 예시에서 변수는 20개 정도 되고 팩터형 변수가 15개 정도(레벨수 2~4개) 된다고 하면 분석을 어떻게 해야할까요?
팩터형 변수를 전부 삭제하는 방법은 안될 것 같아서요..
답변 1
0
안녕하세요.
강의때도 말씀드렸지만 레벨수가 2~4개 정도된다고 하면 그대로 이용하시면 됩니다.
스크립트도 자동으로 원핫인코딩이 들어가는 코드이기 때문에 특별히 처리하실 것도 없습니다.
저는 팩터형변수를 삭제하는 것을 권하지 않습니다.
정확한 숫자를 지정하긴 어렵지만 팩터형변수의 레벨이 너무많다면
(특히 자료내의 오타등으로 인해서 발생함) 삭제하는 것을 권합니다.
str나 levels등의 명령어로 레벨을 확인했는데 이상한 값이 들어가서 레벨이 너무 많다면 삭제를
그렇지 않고 애초에 레벨이 많은 변수이고 전체 데이터셋에 그런 변수가 한 개정도라면 이용을 권합니다.
기본적으로 빅데이터분석기사는 국가공인시험이고 단답형이 아니고 풀이를 요구하기 때문에
만약 위와 같은 경우 팩터형 변수 하나를 삭제했다고 해서 모델의 성능이 급격이 떨어지지 않습니다.
그렇게 한 가지 방법을 강제하는 문제를 낼 수 없기 때문입니다.
특정 변수의 중요도가 높은 유형의 문제를 내기도 어렵습니다.
이 점을 이용해서 위와같은 경우에만 삭제하는 것이 낫다고 말씀드렸습니다.
그럼 좋은하루되세요!
마지막 질문이될것같습니다 선생님!!
0
306
1
5회 2유형
0
358
1
작업형제2유형 질문입니다.
0
430
1
rmse질문입니다.
0
351
1
제5회 빅데이터분석기사 실기 응시 가이드 질문입니다.
0
460
2
제4회 실기시험 리뷰 작업형2문제
0
435
2
출제예상문제풀이 1번 문제 질문입니다
0
298
1
제4회 실기시험 리뷰 작업형1에서 3번문제 질문입니다.
0
203
1
제4회 실기시험 리뷰 작업형1질문 1번문제
0
282
1
회귀모델구축 질문입니다.
0
290
2
작업형 2유형 질문
0
259
1
작업형 제2유형 질문입니다.
0
187
1
작업형제2유형 질문입니다.
0
242
2
제4회 작업형2 실기 질문입니다.
0
293
2
제4회 작업형2 실기시험 질문입니다.
0
336
2
3회 작업형 1유형 전처리 문제
0
277
1
예상문제 작업2유형 샘플파일이 읽혀지지 않는 문제
0
310
3
실기4 유형2 질문
0
210
1
실기 3회 유형2 세부사항 문의
0
248
2
섹션 4 예상문제
0
204
1
열공중입니다 도와주세요 감사합니다!!
0
182
1
학습 질문있습니다!
0
242
1
덕분에 합격했습니다만..
0
186
1
덕분에 합격했습니다.
1
176
1





