강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

yeoun123님의 프로필 이미지
yeoun123

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[작업형1] 연습문제 섹션1 ~ 10

2회기출문제(문1과 연습문제 4번)

해결된 질문

작성

·

23

0

views_min = df['views'][:10].min()

여기부분이 2회기출 설명은 뷰가 앞이고

연습문제 4번에서는 iloc가 앞이에요

views_min = df.iloc[:10]['views'].min()

views와 iloc 순서 바뀌어도 상관없는건가요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 상관없습니다.

컬럼을 먼저 선택하냐, 행을 먼저 선택 하냐의 차이입니다.

얼마 남지 않은 시험 화이팅입니다!!

0

안녕하세요, 인프런 AI 인턴입니다. yeoun123님.

질문하신 내용은 pandas 라이브러리에서 데이터프레임의 인덱싱 또는 슬라이싱을 통해 특정 데이터의 최소값을 구하는 방법에 관한 것입니다. 두 코드가 수행하는 작업과 그 차이점에 대해 설명드리겠습니다.

pandas에서 인덱싱 방식

  1. views_min = df['views'][:10].min():

    • 이 코드는 ‘views’ 열을 먼저 선택하고, 그 후에 처음 10개의 행에서 최소 값을 찾습니다. 즉, 특정 열을 전체 데이터프레임에서 필터링한 후, 슬라이싱을 적용하는 방식입니다.
  2. views_min = df.iloc[:10]['views'].min():

    • 이 코드는 데이터프레임에서 먼저 첫 10개의 행을 선택하고, 그 후 ‘views’ 열의 최소값을 찾습니다. 즉, 행을 먼저 필터링한 후, 특정 열을 선택하는 방식입니다.

차이점과 유의사항

  • 두 방식 모두 본질적으로 동일한 작업을 수행하고, 결과적으로 동일한 값을 반환할 것입니다.
  • 다만, 첫 번째 방식은 열 선택 후 행 슬라이싱이고, 두 번째 방식은 행 선택 후 열 선택으로 기준이 다릅니다. 하지만 데이터의 변경이나 연산의 결과에는 영향을 주지 않습니다. 이는 데이터의 위치 순서 차이에 따른 표현 방식의 차이일 뿐입니다.

결론적으로, viewsiloc의 순서는 결과적으로 영향을 주지 않으므로, 어떤 방식이든지 상관 없습니다. 그러나 코드를 작성할 때 가독성이나 팀의 코딩 규칙에 맞춰 일관되게 사용하는 것이 좋습니다.

참고로 pandas의 ilocloc 사용에 관한 보다 자세한 내용을 원하시면 이 유사한 질문을 참고하실 수 있습니다. 해당 링크에서는 인덱싱 방식의 차이에 대해 더욱 구체적으로 다룹니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

yeoun123님의 프로필 이미지
yeoun123

작성한 질문수

질문하기