inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

원핫인코딩 관련

해결된 질문

206

narae.park325

작성한 질문수 7

0

원핫인코딩 관련하여 질문이 있습니다.

  1. cols = [ object형 컬럼들, , , ] 으로 지정한 후 어떤 문제에서는

pd.get_dummies(df[cols]) 로 되어있는 곳도 있고,

pd.get_dummies(df, columns=cols)로 되어있는 곳도 있는데, 둘다 마찬가지 결과가 나오는걸까요?

 

  1. 추가적으로, 다중분류 부분에서 보면 숫자로되어 있는 object형 변수는 자동으로 원핫인코딩이 되지 않으므로

pd.get_dummies(df[0])으로 코딩해야 한다고 하셨는데요,

그렇다면 위의 예시에서 df, columns=cols로 했을 경우에는 숫자로 되어있는 변수는 dtype이 object형이어도 자동으로 원핫인코딩이 되지않는걸까요..?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

pd.get_dummies(df[cols]) 과 pd.get_dummies(df, columns=cols)는 차이가 있어요

  1. pd.get_dummies(df[cols]):

    • 이 방식은 먼저 df[cols]를 통해 데이터프레임 df에서 cols에 해당하는 열만 선택합니다.

    • 그런 다음 pd.get_dummies를 이용해 이 선택된 부분집합에 대해 원-핫 인코딩을 수행합니다.

    • 결과적으로, 원-핫 인코딩된 데이터프레임은 cols에 지정된 열만 포함하며, df의 다른 열은 포함되지 않습니다.

    • 숫자가 있다면 숫자가 있는 컬럼은 인코딩 하지 않습니다.

  2. pd.get_dummies(df, columns=cols):

    • 이 방식은 원본 데이터프레임 df를 기반으로 합니다.

    • columns=cols 매개변수를 통해 cols에 지정된 열만 원-핫 인코딩을 적용합니다.

    • 결과적으로, 원-핫 인코딩된 열은 cols에 지정된 범주형 열로 대체되지만, df의 다른 열(원-핫 인코딩되지 않은 열)도 결과 데이터프레임에 포함됩니다.

    • 숫자가 있는 컬럼이 있어도 강제로 원핫인코딩 합니다.

 

 

두번째 질문은 조금 이상합니다. 다시 질문 부탁드려요

pd.get_dummies(df[0]) 코드를 제가 설명한 적이 있을까요? df[0]는 저도 알 수 없는 코드라서요~😱

 

 

columns=cols로 했을 경우에는 숫자로 되어있는 변수는 dtype이 object형이어도 자동으로 원핫인코딩이 되지않는걸까요..?

아니요! 겟더미즈에 넣으면 object형은 원핫인코딩 됩니다. 🙂

0

narae.park325

답변 감사드립니다!!

말씀주신 부분은 다중분류 평가지표 부분에서 pd.get_dummies(y_true[0])이라고 되어있는 부분이었습니다.

y_true는 [2, 2, 3, 3, 2, 1,....] 이런 리스트였구요. 숫자면 자동으로 원핫인코딩 되지않아서 [0]을 넣었다고 하셨던것같아서 여쭤봤습니다. 위의 df[cols]와 관련이 있나 했어요^^;;

 

질문 드립니다.

0

38

2

강의 내용 관련 질문드립니다~

0

34

2

수강 연장 문의

0

32

1

강의자료 일괄 다운로드

0

41

2

수강기간 연장 문의드립니다

0

28

1

list 문제 질문드립니다~

0

29

2

빅분기 실기 12회 재도전

0

39

1

강의 기간 연장 가능여부 검토 요청건

0

30

1

수강기간 연장 문의 드립니다

0

36

2

수강기간 연장 문의드립니다

0

47

2

질문이요

0

51

2

수강기간 연장 문의드립니다.

0

50

2

문제 3-2 질문드립니다

0

44

2

수강기간 연장 문의 드립니다.

0

58

2

변수, 칼럼 , df 구분

0

49

2

수강기간 연장 문의드립니다.

0

49

2

수강기간 연장 문의

0

48

2

수강기간 연장 문의드립니다.

0

40

2

수강기한 연장 문의

0

79

2

수강기간 연장 문의드립니다

0

57

2

결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유

0

44

2

수강기간 연장 문의드립니다.

0

71

2

수강연장 문의

0

77

2

수강연장문의

0

53

2