inflearn logo
강의

Course

Instructor

[Side Project After Work] Big Data Analysis Certification Practical Exam (Type 1, 2, 3)

Task Type 1 - Practice Problems 13-15 🆕

map 함수 사용 필수적인가요

4

tngus50872489

1 asked

0

작업형1 - section14 를 먼저 풀었을 때 아래처럼 작성하였습니다

답은 맞게 나오긴하는데 풀이에선 map을 활용하였더라고요. 따라서 써보려고 하는중인데 영 손에 익지않습니다 ㅠㅠ

혹시 이후 과정에서도 map을 많이 사용한다면 최대한 외워보려고 하는데 필수적일까요 ..?

import pandas as pd
# df = pd.read_csv("type1_data1.csv")
df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p1/type1_data1.csv")

#print(df.shape)
# 1 중복 데이터 제거 
df = df.drop_duplicates()

#print(df.shape)

# 2 f3 변환

## 결측치 -> 0
# print(df.isna().sum())
df['f3'] = df['f3'].fillna(0)
# print(df.isna().sum())

## silver -> 1 , gold -> 2, vip -> 3
cond1 = df['f3'] == 'silver'
cond2 = df['f3'] == 'gold'
cond3 = df['f3'] == 'vip'
df[cond1] = 1
df[cond2] = 2
df[cond3] = 3

# 3 f3 sum()
result = df['f3'].sum()
print(result)

python 머신러닝 빅데이터 pandas 빅데이터분석기사

Answer 1

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. 이수현님께서 작업형1의 데이터 변환 과정에서 map 함수를 사용하는 것이 필수적인지에 대한 질문을 주셨네요.

현재 사용하신 방법으로도 f3 컬럼의 변환은 정확하게 수행되고 있으며, 최종 결과가 올바르게 나오는 것에 중점을 두신 것 같습니다. 그럼에도 map을 고려하는 이유는 코드의 간결성 및 효율성에 있습니다. map 함수를 활용하면 조건문을 여러 번 사용하지 않고도 한 줄로 값을 변환할 수 있습니다. 예를 들어:

df['f3'] = df['f3'].map({'silver': 1, 'gold': 2, 'vip': 3}).fillna(0)
  • 위의 코드는 map 함수를 통해 ‘silver’, ‘gold’, ‘vip’이라는 문자열 값을 각각 1, 2, 3으로 변환하며, 동시에 결측치도 0으로 채웁니다. 이처럼 map 함수는 가독성을 높이고 코드의 양을 줄이는 데 도움을 줍니다.

map 함수의 중요성과 활용성

  • map 함수는 Pandas 데이터프레임에서 데이터 변환 시 매우 유용합니다. 특히 범주형 데이터를 수치형 등으로 변환할 때 강력한 도구입니다.
  • 이후 더 복잡한 변환이나 데이터 전처리가 필요한 경우, apply, applymap 등과 함께 사용되기도 하므로 익숙해지는 것이 데이터 처리 과정에서 큰 이점이 될 것입니다.

관련된 기존 질문 및 답변을 참고하시기 바랍니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

수강 기한 연장 문의드립니다.

0

8

1

34강 평가지표

0

18

2

103강 작업2형 전처리(레이블인코딩 부분) 오류

0

11

2

작업형1_section14 문의

0

10

2

작업형1_연습문제 7번 관련입니다.

0

11

2

데이터 프레임 슬라이싱 혹은 데이터 선택하기가 어렵습니다.

0

11

2

크로스 밸리데이션 질문

0

15

2

로지스틱 회귀분석 질문

0

14

2

수치형 데이터만 선택하여 푸는 경우에 오답확률이 높아질까요?

0

23

2

2유형 object 컬럼 인코딩 관련 질문

0

33

2

하이퍼파라미터 변수

0

29

2

52강 이원분산분석

0

26

2

실제시험환경에서 작업형1,2,3의 문제풀이 순서

0

32

2

독립표본검정

0

26

2

tranform을 쓰라는 힌트는 어디서 얻을 수 있나요??

0

38

2

df.describe() 사용을 자제해야할까요?

0

37

2

shape 결과에 대한 문의

0

38

2

자료 문의

0

31

2

8 회귀 11번

0

27

2

심화 강의 관련 질문

0

39

2

빈도수 구하는 것 질문

0

26

2

커리큘럼을 따로 인쇄할 수 있는 방법이 있을까요?

0

40

1

작업형2 머신러닝 문제풀이 중 test 데이터 에러 문의

0

34

2

수강연장가능문의

0

47

2