인프런 커뮤니티 질문&답변
회귀 예측에서 변수 선택
작성
·
223
0
안녕하세요.
여러 질문을 드림에도 친절하고 상세한 답변 항상 감사드립니다.
작업형 2에서 회귀 예측 문제가 나올 경우,
그리고 해당 df에서 변수가 무진장 많고 numeric과 캐릭터형 들이 산재되어 있을때
범주형 변수인 캐릭터형을 굳이 팩터형으로 바꾸지 않고
연속형 numeric 또는 integer 형만 따로 select하도록 전처리를 하면 될까요?
연습하다가 아래와 같은 데이터프래임을 마주하게 되었는데요.
SalePrice를 예측하는 문제입니다.
저렇게 많은 변수들이 나오게 되면
일일이 select 지정해야겠죠?

답변 2
0
안녕하세요. 전처리를 할때 for문을 쓸일을 극히 드뭅니다.
제가 처음에 말씀드린바와 같이 데이터셋도 저렇게 변수가 많은 경우는 출제가능성이 매우 낮습니다.
코드 제한시간이나 작업환경이 그런 데이터를 처리하기에 어렵기 때문에
문제 제출에 분명 한계가 존재합니다.
저도 for문에 익숙하지 않은데요.
시험시간이 매우 길기 때문에 for문을 숙지하기 보다는 메모장을 이용해서
복사 붙여넣기로 문제를 해결하시는 방법을 추천드립니다.
0
안녕하세요.
이런 문제가 출제될 가능성은 매우 낮아보이긴 합니다^^;;
전부 다 제거하시면 안됩니다.
일단, 저 변수들을 전부 Factor로 변경은 해야합니다.
그 이후에 각 변수의 Factor 레벨을 확인하시고 관측치 대비 레벨이 너무 많아서
분석에 불필요할 것 같다고 판단되는 변수만 제외하고 모델을 만드시면 됩니다.
변수가 많으니 직접 손으로 적으셔도 되지만
몇 번째 칼럼인지 숫자만 빼서 for문을 돌리면 좋을 것 같습니다.
답변 감사드립니다.
전처리할때 for문을 돌려야하는 상황이 많이 생길까요?/
for문을 자유자재로 쓸 수 있으려면 어떻게 연습을 해야할까요?
반복문을 마스터하고 싶습니다.ㅠㅠ






감사합니다.