inflearn logo
강의

Course

Instructor

Big Data Analyst Exam Practice (Python)

Lesson 14. Practical Experience - Preprocessing

14강 실전 문제 카테고리 항목문의

397

heroin8

1 asked

0

주구매지점 카테고리화 할때 for문을 써야하는 이유가 있나요???

for문 안쓰고 하기와 같이 했을때 문제되는게 있는지요?

X_train['주구매지점'] = X_train['주구매지점'].astype('category')

X_test['주구매지점'] = X_test['주구매지점'].astype('category')

 

연습문제1 결측치 처리할때도 마찬가지 인데

missing = ['age']

for i in missing:

X_train[i] = X_train[i].fillna(X_train[i].mean())

X_test[i] = X_test[i].fillna(X_train[i].mean())

이거도 for문 안쓰고

X_train['age'] =

X_train['age'].fillna(X_train['age'].mean())

X_test['age'] = X_test['age'].fillna(X_train['age'].mean())

이렇게 했을때 문제되는게 있나요? 실행해보면 결측치 갯수 0으로 정상적으로 처리된거 같은데

왜 for문을 사용하였는지 문의드립니다.

python 빅데이터

Answer 1

0

communityai8509

안녕하세요, 인프런 AI 인턴이에요.

주구매지점 카테고리화나 결측치 처리는 for문을 사용하지 않고도 가능합니다. 하지만 for문을 사용하는 것이 데이터 전처리 과정에서 효율적인 경우가 있습니다.

for문을 사용하면 반복문 안에서 여러 변수에 대한 작업을 한 번에 처리할 수 있습니다. 예를 들어, 여러 카테고리 변수에 대한 작업이 필요한 경우에 for문을 사용하면 코드를 간단하게 유지할 수 있습니다.

결측치 처리의 경우에도 for문을 사용하면 여러 변수에 대한 결측치 처리를 간편하게 처리할 수 있습니다. 하지만 이 경우에도 for문 없이도 처리가 가능합니다.

즉, for문을 사용하는 것이 필수적인 경우는 아니며, 데이터 양이 많은 경우 for문 대신 다른 방법을 고려해볼 필요가 있습니다.

이번 케이스에서는 for문이 사용되었을 이유는 코드 작성자가 for문을 통해 코드 작성을 편리하게 할 수 있었기 때문입니다.

그러나 데이터의 양과 종류에 따라 다른 방법이 더 효율적일 수 있으므로, 데이터 전처리 방법 선택에 있어서는 상황에 맞게 판단하는 것이 필요합니다.

답변이 도움이 되었기를 바라며, 더 궁금하신 점은 언제든지 댓글로 질문해주세요. 감사합니다.

구름IDE 서비스 종료 이후 학습환경

0

122

1

10강 연습문제

0

166

1

VotingClassifier Hard 사용

0

111

1

구름IDE 실행 도움 요청

0

162

1

질문입니다 RandomForestClassifier

0

170

1

질문!

0

340

1

데이터 더미화 에러발생 질문.

0

317

1

많은 컬럼과 많은 결측치를 가지는 데이터

0

201

1

Dataset은 어디서 받을 수 있나요?

0

395

1

mpg 데이터셋 위치

0

339

1

교육영상 4강. 작업유형1-문제(1)에 대한 코드는 어디서 받을 수 있나요?

0

376

1

단순평균(1집단)T-test 1번 풀이

0

480

2

강의자료 문의

1

549

1

구름IDE 실행불가문제 ㅠㅠ

0

808

2

제7강 작업유형2-데이터 전처리: LabelEncoder 문법

0

443

1

5강 작업유형1-문제 2 질문입니다

0

407

1

7강 코드 질문드립니다

0

414

1

작업2유형 문의

0

464

1

데이터셋 분리와 관련하여 질문이 있습니다.

0

446

1

5강의 작업형1-2문제 오류

0

460

1

구름 IDE

0

712

2

[공지] 데이터 전처리 관련 오류 수정

4

546

1

라벨인코더 관련 문의드립니다!

0

506

2

분류 예측에서 결과값의 구체적 내용을 확인할수 있는지요?

0

402

2