pandas 라이브러리로 실제 데이터 전처리하기2 8:42
283
작성한 질문수 15
ㄴㅇㄹ
Province_State Country_Region Confirmed
0 Anhui China 1.0
1 Beijing China 14.0
2 Chongqing China 6.0
3 Fujian China 1.0
5 Guangdong China 26.0
6 Guangxi China 2.0
7 Guizhou China 1.0
8 Hainan China 4.0
9 Hebei China 1.0
11 Henan China 5.0
13 Hubei China 444.0
14 Hunan China 4.0
16 Jiangsu China 1.0
17 Jiangxi China 2.0
19 Liaoning China 2.0
20 Macau China 1.0
21 Ningxia China 1.0
24 Shandong China 2.0
25 Shanghai China 9.0
26 Shanxi China 1.0
27 Sichuan China 5.0
28 None None NaN
29 Tianjin China 4.0
31 None None NaN
33 Yunnan China 1.0
34 Zhejiang China 10.0
35 None None NaN
36 None None NaN
37 NaN Korea, South 1.0

Province_State Country_Region Confirmed
0 Anhui China 1
1 Beijing China 14
2 Chongqing China 6
3 Fujian China 1
5 Guangdong China 26
6 Guangxi China 2
7 Guizhou China 1
8 Hainan China 4
9 Hebei China 1
11 Henan China 5
13 Hubei China 444
14 Hunan China 4
16 Jiangsu China 1
17 Jiangxi China 2
19 Liaoning China 2
20 Macau China 1
21 Ningxia China 1
24 Shandong China 2
25 Shanghai China 9
26 Shanxi China 1
27 Sichuan China 5
28 Taiwan Taiwan 1
29 Tianjin China 4
31 Washington US 1
33 Yunnan China 1
34 Zhejiang China 10
35 NaN Japan 2
36 NaN Thailand 2
37 NaN Korea, South 1
두 코드의 차이는 return의
위치입니다.
근데 왜 Confirmed 타입과 값이 이렇게 차이나나여?
답변 1
1
안녕하세요. 답변 도우미입니다.
두 스크린샷 모두 동일한 함수 func를 정의하고 있으며, doc라는 DataFrame에 apply 메소드를 사용하여 이 함수를 적용하고 있습니다. 두 코드 사이의 주요 차이점은 return row 문의 위치입니다.
첫 번째 이미지에서는 return row가 if 블록 내부에 있습니다. 이는 if 조건이 참인 경우에만 행(row)이 반환되고, 그렇지 않으면 함수는 None을 반환합니다. 즉, 조건이 거짓인 경우 함수는 아무런 값도 반환하지 않기 때문에, apply 메소드는 해당 행에 대해 None을 받게 되고, 그 결과로 해당 행은 변경되지 않습니다.
두 번째 이미지에서는 return row가 if 블록 밖에 있습니다. 이는 if 조건의 참/거짓 여부와 관계없이 함수가 항상 행을 반환하도록 합니다. if 조건이 참이면 'Country_Region' 값이 json_data로 업데이트되고, 거짓이더라도 원래 행이 그대로 반환됩니다.
'Confirmed' 타입과 값이 달라지는 것은, apply 메소드가 행을 처리할 때 함수의 반환 값을 DataFrame에 다시 할당하기 때문입니다. 첫 번째 경우에는 'Confirmed' 열이 함수에서 처리되지 않는다면, 원본 값이 그대로 유지되지만, 두 번째 경우에는 어떤 변화가 있었을 때 그 변화가 적용되어 결과적으로 'Confirmed' 열의 타입이나 값에 영향을 줄 수 있습니다.
감사합니다.
Python 3 표시 없습니다.
0
58
1
강의실습 말고 강의에 대한 자료(pdf)가 없을까요?
0
69
1
구글 코랩과 아나콘다
0
83
1
강의와 다르게 오류가 뜨는 이유가 뭘까요?
0
99
1
COVID-19-master 관련 등 자료 누락
0
87
1
수업자료에 python_core_summary.ipynb 파일이 포함되어 있지 않습니다!
1
97
1
json.dumps관련된 질문
0
72
1
빅분기대비
0
112
1
파이썬으로 Plain Text 포멧 파일 다루기 연습문제 질문
0
93
1
강의자료 어디서 다운로드받나요?
0
139
1
pandas 라이브러리의 quotechar 인자에 대해 질문드립니다
0
101
1
iplot 에러 문제
1
200
1
플래그
0
76
1
플래그 라이브러리
0
85
1
CSV 파일 쓰기 다른 기법(사전 타입으로 쓰기) 관련
0
179
1
CSV 파일 읽을 때 오류
0
193
1
read() 함수 사용할 때 3번째 줄에 data로 출력 또는 print(data)로 출력 차이
0
136
1
강의 교재 및 실습 파일 제공되나요?
0
181
1
deep_data_and_visual 파일에서 에러가 납니다.
0
182
1
apply()함수
0
201
1
pandas groupby sum 질문
1
272
1
pandas_eda 자료 맨아래 heatmap 숫자가 안나옵니다
0
351
2
pandas_eda 힛맵에서 숫자가 안떠요
0
255
1
수업 자료에 pandas_basic 파일이 없습니다..!
0
277
1





