인프런 커뮤니티 질문&답변
작성자 없음
작성자 정보가 삭제된 글입니다.
3개 이상의 분류문제
작성
·
210
0
안녕하세요. 올려주신 강의는 짧은 시간에 빅분기 대비에 많은 도움이 되고 있습니다.
작업형 2유형에 대한 문의입니다.
분류 모델(또는 회귀모델)에 대한 예시로 caret 패키지의 train함수에서 method = 'glm'과 method = 'rpart'를 사용하는 법을 알려주셨습니다. 다만, 성별과 같은 이항분류가 아니라 3개 이상의 분류에 대한 문제를 풀때도 method = 'glm'이 여전히 유효한지 궁금합니다. glm은 아마도 이항 로지스틱회귀분석 모델이 아닌가 싶어서요. 이때는 random forest 같은 것을 사용해야 할 것 같은데, ntree나 mtry는 어떻게 설정해야 할지요?
답변 1
0
companionclub
지식공유자
안녕하세요.
두 개를 초과하는 클래스를 가지는 모델에 대해서
여쭈셨는데요. 제가 소개해드린 방법은 이진분류에
대해 유효한방법입니다. 그것을 초과하는 경우는
다른 모델링 방법이 필요하며 그건 강의 범위를
초과할 것 같습니다. 다만, 빅데이터 실기시험 수준
을 봤을 때 분류문제는 이진분류수준에서 출제될 것이
라고 판단됩니다. 기본적인 랜덤포레스트 역시
이진분류에 유효하며 그때 mtry ntree는 caret의
랜덤서치와 그리드서치를 이용해서 파라미터 튜닝을
하게됩니다. 하지만 그럴경우 전체 코드실행시간이
1분을 넘을수있어서 0점처리가 될 수있으니
추천드리지않는 방법입니다. 감사합니다.





