inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제1

인코딩 사용여부

68

personal_92

작성한 질문수 12

0

인코딩 사용할 때 어떠한 기준으로

원핫인코딩 vs 라벨인코딩으로 진행해야할까요 ?

그냥 전처리할때는 only 원핫인코딩 적용해도 무방할까요 ?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

네, 한가지만 해도 좋습니다. 충분합니다.

비교해보면 더 좋고요!

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. personal_92님.

머신러닝에서 범주형 데이터를 수치형으로 변환하는 인코딩 과정은 매우 중요합니다. 여기에서는 원핫인코딩(One-Hot Encoding)과 라벨인코딩(Label Encoding) 사용 시 유의해야 할 점을 설명드리겠습니다.

원핫인코딩(One-Hot Encoding) 사용 방식:

  • 범주의 수가 적고, 범주 간의 순서나 크기 비교가 필요 없을 때 적합합니다. 예를 들면, ‘색상’은 ‘빨강’, ‘파랑’, ‘초록’ 등으로 구분될 수 있고, 서로 독립적입니다.
  • 원핫인코딩은 각 범주를 0과 1의 이진 벡터로 변환하여, 모델에서 범주 간의 거리를 인식하지 않도록 돕습니다.

라벨인코딩(Label Encoding) 사용 방식:

  • 범주 간에 순서나 크기가 중요하거나, 범주의 수가 많아 데이터 차원이 많이 증가할 경우 적합합니다.
  • 범주가 많을 때 모든 범주를 원핫인코딩하면 데이터의 차원이 상당히 증가하여 계산 부담이 커지므로, 이런 경우 라벨인코딩이 범주를 숫자로 나타내어 효율적일 수 있습니다. 그러나 회귀 모델에서는 주의해야 합니다. 숫자를 통한 암시적 순서가 문제가 될 수 있습니다.

선택하기 위한 기준:

  • 데이터의 특성과 모델의 요구사항에 따라 인코딩 방식을 선택하는 것이 좋습니다. 일반적으로 순서가 없는 범주형 데이터는 원핫인코딩으로, 순서가 있는 데이터는 라벨인코딩으로 처리됩니다.

추가적으로 다음의 유사한 질문과 답변을 참고하시면 도움이 될 것입니다:
- “원핫인코딩, 라벨인코딩 중 하나 결정해야할때”: 두 인코딩 방식의 장단점과 적합한 상황에 대해 설명하고 있습니다.
- “원핫 인코딩 , 라벨인코딩 선택의 기준”: 범주형 데이터의 차원 증가 문제 관련 인코딩 방식을 선택하는 추가적인 기준이 제공되고 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

재검토 요청 방법 좀 알려주셔요...-.-;;

0

28

2

12회 실기 질문(작업형 2)

0

26

2

뒤로가기 버튼 같은 것이 있나요?

0

39

1

강의 연장 문의

0

45

2

출력값 질문

0

37

2

수업노트가 어디에 있나요?

0

34

1

실기시험 제출관련

0

179

3

6.20 작업형 2 과적합

0

183

3

코딩팡 장업형2 베이스 라인 인코딩 종류 질문

0

57

2

로지스틱회귀, 회귀

0

53

2

회귀 문제를 풀때 질문입니다.

0

61

1

불균형 처리 후 성능이 더 낮아졌다면,

0

67

2

실기 체험 제2유형 에러 문의

0

69

1

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

0

54

2

3번문제 등분산 가정

0

52

2

작업형3 target 형 변환 질문

0

39

2

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

41

3

원핫인코딩과 레이블 인코딩에서 concat

0

63

2

제2유형 질문입니다.

0

50

2

C()

0

46

2

작업형 2에서 strafity 적용 유무

0

56

2

수강 기간 연장 가능 여부 문의드립니다.

0

71

2

ols

0

45

2

2유형 작성관련 질문(일반 심화)

0

42

2