2회 기출 1번 문제

Question

1번 문제 코드를 짜보았는데 결과 값이 조금 다른 것 같아서 질문 드립니다 import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p1/members.csv") df.nlargest(10, 'views') m=df.loc[21,'views'] df.iloc[:10,-1]=m cond=df['age']>=80 df[cond]['views'].mean()

퇴근후딴짓 · Answer

df.iloc[:10,-1]=m 이 코드가 문제입니다. df.nlargest(10, 'views')로 가장 큰 10개를 확인했지만 확인만 했을 뿐 df는 원래 순서대로 입니다. 그런데 iloc로 값을 대체 하면 그냥 처음부터 10번째까지 변경한 것이 반영됩니다. 큰 값 10개랑은 무관함 이에 한줄 한줄 결과를 출력하면서 눈으로 확인할 필요가 있어요!

인프런 AI 인턴 · Answer

안녕하세요, 인프런 AI 인턴입니다. 99ethan님. 주어진 문제는 &lsquo;views&rsquo; 컬럼에서 상위 10개 데이터를 특정 값으로 대체하고, &lsquo;age&rsquo; 컬럼에서 80 이상인 데이터의 &lsquo;views&rsquo; 평균을 계산하는 것입니다. 코드에서 주의할 점과 해결 방법을 안내드리겠습니다. 문제 해결 과정 설명 상위 10개 데이터 처리 : df.nlargest(10, 'views') 를 통해 &lsquo;views&rsquo; 컬럼에서 상위 10개의 행을 얻는 과정 자체는 맞습니다. 하지만 이를 그냥 콘솔에 출력하는 것만으로는 데이터프레임에 변경이 적용되지 않습니다. 상위 10번째 값 대체 : m=df.loc[21,'views'] 코드를 통해 상위 10번째 값을 찾고 있습니다. 이때 특정한 인덱스 값(21)을 사용하고 있는데, 이 방법은 잘못된 결과를 초래할 수 있습니다. 대신, 상위 10개의 &lsquo;views&rsquo; 중 최솟값을 직접 구해야 합니다. 대체 적용 : df.iloc[:10,-1]=m 에서 -1은 마지막 컬럼이라고 이해되지만, 명시적으로 'views' 라고 쓰는 것이 분명합니다. 조건부 평균 계산 : cond=df['age']>=80 에 따라 조건을 부여하고, df[cond]['views'].mean() 을 통해 평균을 계산합니다. 코드 개선사항 import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p1/members.csv") # 'views' 컬럼에서 상위 10개의 데이터를 가져온 후, 그 중 최솟값을 구합니다. top_10_views = df.nlargest(10, 'views')['views'] min_of_top_10 = top_10_views.min() # 상위 10개 'views' 데이터를 최솟값으로 대체합니다. df.loc[df.nlargest(10, 'views').index, 'views'] = min_of_top_10 # 조건을 적용하여 평균값을 구합니다. cond = df['age'] >= 80 print(df[cond]['views'].mean()) 이 코드는 상위 10번째 &lsquo;views&rsquo; 값을 직접 지정하는 대신, nlargest() 함수로 가장 큰 값 10개를 추출하여 그 중 최소값으로 대체하는 방법을 사용하여 문제를 해결합니다. 이와 유사한 문제 및 그 해결 과정에 대한 논의는 아래 링크를 통해 확인하실 수 있습니다: 2회 기출 작업형 1문 풀이 질문있습니다. 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.