inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]

pandas 라이브러리로 실제 데이터 전처리하기2 8:42

283

phys

작성한 질문수 15

1

ㄴㅇㄹ

 Province_State Country_Region  Confirmed
0           Anhui          China        1.0
1         Beijing          China       14.0
2       Chongqing          China        6.0
3          Fujian          China        1.0
5       Guangdong          China       26.0
6         Guangxi          China        2.0
7         Guizhou          China        1.0
8          Hainan          China        4.0
9           Hebei          China        1.0
11          Henan          China        5.0
13          Hubei          China      444.0
14          Hunan          China        4.0
16        Jiangsu          China        1.0
17        Jiangxi          China        2.0
19       Liaoning          China        2.0
20          Macau          China        1.0
21        Ningxia          China        1.0
24       Shandong          China        2.0
25       Shanghai          China        9.0
26         Shanxi          China        1.0
27        Sichuan          China        5.0
28           None           None        NaN
29        Tianjin          China        4.0
31           None           None        NaN
33         Yunnan          China        1.0
34       Zhejiang          China       10.0
35           None           None        NaN
36           None           None        NaN
37            NaN   Korea, South        1.0

 

 

   Province_State Country_Region  Confirmed
0           Anhui          China          1
1         Beijing          China         14
2       Chongqing          China          6
3          Fujian          China          1
5       Guangdong          China         26
6         Guangxi          China          2
7         Guizhou          China          1
8          Hainan          China          4
9           Hebei          China          1
11          Henan          China          5
13          Hubei          China        444
14          Hunan          China          4
16        Jiangsu          China          1
17        Jiangxi          China          2
19       Liaoning          China          2
20          Macau          China          1
21        Ningxia          China          1
24       Shandong          China          2
25       Shanghai          China          9
26         Shanxi          China          1
27        Sichuan          China          5
28         Taiwan         Taiwan          1
29        Tianjin          China          4
31     Washington             US          1
33         Yunnan          China          1
34       Zhejiang          China         10
35            NaN          Japan          2
36            NaN       Thailand          2
37            NaN   Korea, South          1

 

 

 

두 코드의 차이는 return의

위치입니다.

근데 왜 Confirmed 타입과 값이 이렇게 차이나나여?

 

python pandas

답변 1

1

잔재미코딩 DaveLee

안녕하세요. 답변 도우미입니다.

두 스크린샷 모두 동일한 함수 func를 정의하고 있으며, doc라는 DataFrame에 apply 메소드를 사용하여 이 함수를 적용하고 있습니다. 두 코드 사이의 주요 차이점은 return row 문의 위치입니다.

첫 번째 이미지에서는 return rowif 블록 내부에 있습니다. 이는 if 조건이 참인 경우에만 행(row)이 반환되고, 그렇지 않으면 함수는 None을 반환합니다. 즉, 조건이 거짓인 경우 함수는 아무런 값도 반환하지 않기 때문에, apply 메소드는 해당 행에 대해 None을 받게 되고, 그 결과로 해당 행은 변경되지 않습니다.

두 번째 이미지에서는 return rowif 블록 밖에 있습니다. 이는 if 조건의 참/거짓 여부와 관계없이 함수가 항상 행을 반환하도록 합니다. if 조건이 참이면 'Country_Region' 값이 json_data로 업데이트되고, 거짓이더라도 원래 행이 그대로 반환됩니다.

'Confirmed' 타입과 값이 달라지는 것은, apply 메소드가 행을 처리할 때 함수의 반환 값을 DataFrame에 다시 할당하기 때문입니다. 첫 번째 경우에는 'Confirmed' 열이 함수에서 처리되지 않는다면, 원본 값이 그대로 유지되지만, 두 번째 경우에는 어떤 변화가 있었을 때 그 변화가 적용되어 결과적으로 'Confirmed' 열의 타입이나 값에 영향을 줄 수 있습니다.

감사합니다.

Python 3 표시 없습니다.

0

58

1

강의실습 말고 강의에 대한 자료(pdf)가 없을까요?

0

69

1

구글 코랩과 아나콘다

0

83

1

강의와 다르게 오류가 뜨는 이유가 뭘까요?

0

99

1

COVID-19-master 관련 등 자료 누락

0

87

1

수업자료에 python_core_summary.ipynb 파일이 포함되어 있지 않습니다!

1

97

1

json.dumps관련된 질문

0

72

1

빅분기대비

0

112

1

파이썬으로 Plain Text 포멧 파일 다루기 연습문제 질문

0

93

1

강의자료 어디서 다운로드받나요?

0

139

1

pandas 라이브러리의 quotechar 인자에 대해 질문드립니다

0

101

1

iplot 에러 문제

1

200

1

플래그

0

76

1

플래그 라이브러리

0

85

1

CSV 파일 쓰기 다른 기법(사전 타입으로 쓰기) 관련

0

179

1

CSV 파일 읽을 때 오류

0

193

1

read() 함수 사용할 때 3번째 줄에 data로 출력 또는 print(data)로 출력 차이

0

136

1

강의 교재 및 실습 파일 제공되나요?

0

181

1

deep_data_and_visual 파일에서 에러가 납니다.

0

182

1

apply()함수

0

201

1

pandas groupby sum 질문

1

272

1

pandas_eda 자료 맨아래 heatmap 숫자가 안나옵니다

0

351

2

pandas_eda 힛맵에서 숫자가 안떠요

0

255

1

수업 자료에 pandas_basic 파일이 없습니다..!

0

277

1