문제 6번
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
이상치 제거를
df = df[(df['age'] == df['age'].astype(int) ) & df['age'] >0]
이렇게 하면 틀린건가요?
round쓰는게 이해가 안가네요
답변 2
0
아니요! 작성한 코드를 사용해도 됩니다.
라운드(반올림)를 써도 되고 절사를 써도 됩니다.
어떤 방식으로든 소수점 데이터라면
기존데이터(소수점)와 변경된 데이터(반올림, 절사 등) 다르면 false가 나오게 됩니다.
0
안녕하세요, 인프런 AI 인턴입니다.
윰님께서 질문하신 부분과 관련하여, 데이터의 소수점 처리를 통해 이상치를 제거하는 방법에 대해 설명드리겠습니다. 사용하신 df['age'] == df['age'].astype(int) 코드는 나이 값을 정수로 변환한 것과 동일한 값을 가진 행들을 필터링하여 소수점 부분이 없는 나이만 남기려는 의도입니다. 그러나 이 방법은 반올림이 아닌 단순 절삭(truncation)을 통해 소수점을 제거합니다.
반면, round 함수를 사용하게 되면 반올림 처리를 통해 소수점 첫째 자리까지 반올림하여 비교합니다. 윰님께서 round 함수 사용에 대해 질문하신 것과 관련하여 몇 가지 추가 정보를 제공해 드리겠습니다:
round함수의 사용:round(df['age'], 0)는 소수점 첫째 자리에서 반올림하여 각 값이 가장 가까운 정수로 변환됩니다. 이는 단순히 정수형(int)으로 변환하는 것과 차이가 있습니다. 예를 들어, 3.6이int를 사용하면 3으로 절삭되지만,round를 사용하면 4로 변환됩니다.이상치 제거: 애초에 질문하신 조건식
df[(df['age'] == df['age'].astype(int)) & (df['age'] > 0)]은 소수 부분이 제거되는 게 아니라 정수로 표현 가능한(소수점이 없는) 양의 값만 필터링 됩니다. 반면에 round를 활용하면 소수점 반올림 후 값과 원래의 값을 비교하여 동일한 값을 필터링하려는 의도가 포함될 수 있습니다.
이와 관련된 유사 질문은 아래 링크를 통해 살펴보실 수 있습니다:
- 작업형1 모의문제2 6번: 소수점을 제외하고 조건에 맞는 값을 필터링하는 방법을 설명하고 있으며, pandas의 다양한 기능에 대한 예시를 제공하고 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
작업형2 인코딩 질문
0
11
2
작업형 3 벼락치기 공부방법 질문
0
14
2
기출 11회 작업형 2_전체 데이터 학습 여부
0
27
2
예측값 결과 소수점 차이
0
24
2
기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?
0
25
1
전처리 train() test([ ])
0
18
2
작업형 1 배경지식 질문
0
24
2
옳게 풀은건지 질문드립니다!
0
15
1
roc_auc_score
0
28
2
추가질문 합니다
0
18
2
시험환경 구름
0
19
2
2유형 질문드려요
0
17
2
RandomForest vs lgb
0
25
2
전처리 관련질문
0
25
3
작업형3 기출
0
18
2
유형2에서 데이터분할 생략 가능여부
0
30
2
9회 기출 유형3 질문
0
21
2
lgb 기초편
0
17
2
괄호 사용
0
25
2
작업형 2 데이터 전처리 질문
0
22
1
11회 기출 유형 작업형1 문제 3-1
0
20
1
예시문제 작업형2 (ver2023) 질문입니다
0
20
2
Data type에 따른 처리
0
21
2
데이터 전처리 관련
0
21
2





