회귀분석, 분산분석 범주형 변수
선생님 안녕하세요, 3유형 공부하다가 궁금한 점이 있어서 질문남깁니다.
선형회귀분석에서 독립변수가 범주형일 경우에 원핫인코딩 처리를 안하고, C( )처리를 안해도 자동으로 인코딩이 되는건가요??
반면에 anova에서는 꼭 C ( )를 붙여야 범주화변수 처리가 되나요???
답변 1
0
문자로 되어 있는 경우 붙이지 않아도 되지만
범주형인데 숫자로 되어 있다면 붙여 줘야 합니다. 🙂
0
앗 그럼 범주형인데 숫자로 되어 있는 경우에 C 붙이는 것이 선형회귀, 로지스틱회귀, 분산분석에 모두 해당하는건가요!!?
숫자로 되어 있는데 범주형인지, 수치형인지 구분이 불가능할 경우에 모두 C를 붙여도 무방한가요!?ㅜㅠㅠㅠ
0
아니요! 모두 붙이면 안됩니다.
회귀 분석에서 모두 붙여 버리면 에러가 나거나 이상한 결과가 도출됩니다.
숫자인데 범주형이라면 문제에서 명시하거나 상식적으로 누구나 알만한 변수 일 것으로 예상됩니다.
작업형2 모의문제1 (30강)
0
18
1
수강 기간 연장 문의 드립니다.
0
21
1
수강 계획과 관련해 문의 드립니다.
0
19
1
작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?
0
44
2
작업형 1 -연습문제 4-6
0
32
2
작업형 1 유형 부분
0
40
2
작업형 1 (삭제예정, 구 버전)
0
50
2
수강기간 연장 문의드립니다.
0
35
1
2유형 레이블 인코딩 VS 원핫 인코딩
0
36
3
수강기간 연장 문의드립니다.
0
38
1
인덱스 슬라이싱
0
35
2
질문 드립니다.
0
49
2
강의 내용 관련 질문드립니다~
0
46
2
수강 연장 문의
0
63
2
강의자료 일괄 다운로드
0
58
2
수강기간 연장 문의드립니다
0
47
2
list 문제 질문드립니다~
0
38
2
빅분기 실기 12회 재도전
0
62
2
강의 기간 연장 가능여부 검토 요청건
0
49
2
수강기간 연장 문의 드립니다
0
45
2
수강기간 연장 문의드립니다
0
52
2
질문이요
0
57
2
수강기간 연장 문의드립니다.
0
60
2
문제 3-2 질문드립니다
0
47
2





