강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

현우님의 프로필 이미지
현우

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

4-3 작업형1 모의문제3의 문제7번 문의드립니다

작성

·

40

0

  • df = pd.read_csv("data.csv", index_col="Unnamed: 0")

    # your code


    df=df.T

  •  

    df.head()

     

  • #print(df[2001].mean())

  •  

    a=sum(df[2001]>df[2001].mean())

  •  

    #print(df[2003].mean())

  •  

    b=sum(df[2003]<df[2003].mean())

  •  

    print(a+b)

 

이렇게 풀어도 괜찮은걸까요??

답변 2

0

안녕하세요, 인프런 AI 인턴입니다. 현우님께서 문의하신 내용에 대해 답변드리겠습니다.

먼저, 제공해주신 코드는 데이터 프레임을 ‘Transpose’하여 행과 열을 변환한 후, 각 연도(2001, 2003)의 평균과 비교하여 조건을 만족하는 개수를 계산하는 코드입니다. 이 방식은 데이터의 특정 집합의 평균과 비교하여 특정 조건을 충족하는 행(또는 열)의 수를 찾는 일반적인 방법이며, 문제의 요구사항에 맞게 잘 작성되어 있습니다.

그러나 몇 가지 주의할 점이 있습니다:
1. df=df.T 코드로 인해 데이터 프레임의 행과 열이 바뀌므로, 최종적으로 참조하는 각 열의 라벨(2001, 2003)이 기존의 열 라벨이 아닌, 이제는 행의 라벨이 됩니다.
2. 각 연도의 데이터를 열로 변환했기 때문에, mean() 함수는 각각의 요소에 대해 정확히 작동할 것입니다.

다른 유사한 질문에서는 이러한 방법이 적절한지에 대해 아래와 같은 답변을 제공합니다:
- 작업형1 모의문제3 7번 문제 : 이 질문에서는 데이터의 ‘Transpose’ 이후 특정 조건에 대한 결과를 계산하는 다른 방법을 설명합니다.
- 섹션4 작업형 모의문제3/문제7번 관련 : 이 질문에서는 데이터의 ‘Transpose’ 이후 연도별 평균과 비교하는 방법이 타당한지 확인하는 사례를 안내합니다.

따라서, 현우님이 제공해주신 코드는 문제를 해결하기 위한 올바른 방법으로 보이며, 문제의 요구를 충족시키는 방법 중 하나입니다. 코드를 통해 연도별 평균과 데이터를 비교하여 맞는 노출 개수를 계산하는 방식은 문제 해결에 적합합니다.

저는 질문자님의 이해를 돕고자 기존 답변을 참고하여 유사한 답변을 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 좋습니다. 그런데 헷갈릴 수 있어
df[2001].mean()

은 따로 뽑는 것(변수에 저장)이 좋을 것 같아요!

현우님의 프로필 이미지
현우

작성한 질문수

질문하기