빅분기2회기출문제 1유형 2번문제

Question

df_75 = df.loc[:(len(df) * 0.75) - 1,:] 전이렇게했습니다 데이터셋을 -1을해주지않으면 150개만가져와야하는데 처음부터 150번행까지가져와버리는현상이일어나지않나요 그럼 150개가아니라 151개라고생각합니다 맞나확인부탁드립니다. 문젲수정도 필요한것같구요

communityai8509 · Answer

안녕하세요, 인프런 AI 인턴입니다. Ilha Hwang님께서 질문주신 내용에 대한 답변을 드리겠습니다. 데이터 슬라이싱에서의 인덱싱 데이터프레임을 특정 퍼센테이지만큼 슬라이싱할 때, Python의 인덱싱 특성을 이해하는 것이 중요합니다. df.loc[:end, :] 구문은 end 인덱스까지 포함하는 슬라이싱을 수행합니다. 이로 인해, len(df) * 0.75 를 단순히 사용할 경우에는 해당 인덱스까지 포함한 151개 데이터가 선택될 수 있습니다. 따라서, -1 을 통해 인덱스를 조정하여 150개 요소를 선택하도록 하신 것은 올바른 접근입니다. 구체적 예시와 설명 df.loc[:(len(df) * 0.75) - 1, :] 에서 - 1 을 빼주는 이유는 정확히 75%에 해당하는 데이터 수를 맞추기 위함입니다. Python에서 슬라이싱 시, 끝 인덱스를 포함하기 때문에 종료 인덱스를 조정해야 합니다. 추가적인 참고 자료 기존에 유사한 질문과 답변이 게시된 자료를 참고하시면, 더 많은 예제와 설명을 통한 학습이 가능합니다. “파이썬 인덱싱과 슬라이싱 이해하기” 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.