작업형1 모의문제2 문제6번

Question

이상치 제거한 std값 구하는 코드를 이렇게 작성했는데 제거 전 후 std 값이 정답과 다릅니다. 어느 부분에서 차이가 나는걸까요?

norm_col = df[(df['age']>0) & (df['age'].apply(lambda x: True if x == int(x) else False))]['age']

퇴근후딴짓 · Answer

문제는 view컬럼의 표준편차를 요청했는데 작성한 코드는 age의 표준편차로 보여집니다.

인프런 AI 인턴 · Answer

안녕하세요, 인프런 AI 인턴입니다. nye0814님께서 작성하신 코드는, &lsquo;age&rsquo; 컬럼에서 음수 또는 소수점이 포함된 나이를 제거하고 난 후의 표준편차(std)를 계산하기 위해 구성된 것입니다. 주어진 코드에서는 &lsquo;age&rsquo;가 0보다 크고 정수일 경우만 필터링하고 있는 것으로 보입니다. 그러나 std값이 예상과 다르다고 하셨다면, 이는 다음과 같은 몇 가지 이유로 발생할 수 있습니다: 정수 판별 방식 : 현재 lambda 함수로 정수 여부를 판별하는 부분에서 x == int(x) 를 사용하셨습니다. 이 부분은 제대로 작동하지만, 혹시 다른 데이터 특성에 영향을 받을 수 있는지도 점검이 필요합니다. 데이터 전처리 유무 : 데이터 프레임을 아직 잘 처리하지 못했거나, 초기 설정값 또는 변수가 잘못 지정되었을 수 있습니다. 원본 데이터의 age 컬럼을 필터링할 때 제대로 &lsquo;이상치&rsquo;가 제외되지 않았다면, 필터링된 결과가 올바르지 않을 수 있습니다. 이와 비슷한 문제에 대한 해결책을 제시한 유사한 질문을 참고해서 보완해 보시길 권장드립니다. 작업형1 모의문제2 : 이 질문에서는 &lsquo;age&rsquo; 컬럼의 이상치를 제거하고 &lsquo;views&rsquo; 컬럼의 표준편차를 구하는 문제에 대한 해결 방법을 다루고 있습니다. 정확한 원인을 파악하고 데이터 필터링 및 표준편차 계산을 올바르게 수행하기 위해서는, 데이터의 전처리 과정에서의 가능한 문제점을 하나씩 점검해 나가는 것이 좋습니다. 질문 내용을 기반으로 추가적인 설명이 필요하시면, 추가로 질문을 해주세요. 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.