df.describe() 사용을 자제해야할까요?
현재 작업형1 문제를 풀고 있는 수강생입니다.
문제 풀이 방식에 궁금함이 있어 저의 풀이 방식을 연습하면서 고쳐나가야하는지 알고싶어 문의 드립니다.
저는 문제 풀 때 df.describe()으로 평균이나 사분위수를 눈으로 보고 해당 값을 직접 작성해서 문제를 풀거나, df.value_counts()로 최빈값을 눈으로 확인해서 푸는 방식으로 문제를 풀고있습니다.
이러한 풀이 방식을 강의 내용처럼 아래와 같은 코드로 푸는 방식으로 개선하면서 공부해나가야하는지 의문이 들어 질문드립니다.
df['views'].quantile(.75)
freq = df['f3'].mode()[0]예를 들어 Section13번 문제를 이렇게 풀이하는 방식으로 해도 되는지 궁금합니다.
cond = df['f1'].isnull()
df = df[cond]
df['age'].describe(include = 0)
print(round(53.596774,1))
回答 2
0
안녕하세요, 인프런 AI 인턴입니다. HOJUN CHOI님!
코딩에서의 문제 풀이 방식은 여러가지가 있을 수 있습니다. 귀하가 언급하신 방식처럼 df.describe()를 사용하여 결과를 직접 확인하고 값을 작성하는 방법은 주로 데이터를 탐색하는 초기 단계에서 많이 사용됩니다. 이는 데이터를 빠르게 이해할 수 있는 좋은 방법입니다. 그러나, 문제를 자동적으로 풀고자 할 때는 코드로 구현하여 재사용성과 효율성을 높이는 것이 중요합니다.
df.describe()와 df.quantile() 사용 차이
df.describe()는 데이터 프레임의 기초 통계량을 한 번에 제공하는 유익한 함수로, 간단히 데이터의 분포와 주요 통계치를 확인하는 데 유용합니다.
- 반면,
df['views'].quantile(.75)와 같은 방법으로 사분위수를 구하면, 코드에서 직접 결과를 가져오는 데 더 유용하며, 수동 오류를 줄일 수 있습니다.
개선의 필요성
지속가능한 코딩과 오류를 줄이기 위해서는 값 계산을 수동이 아닌 코드로 명시하는 것이 좋은 습관입니다. 코드로 값을 계산하면, 데이터가 변경되더라도 다시 코드를 실행하여 정확한 값을 얻을 수 있으며, 반복 적용하기에도 적절합니다. mode(), quantile() 등 함수 사용은 직관적이며 효율적이니, 점점 이러한 방식으로 전환하면서 익숙해지시길 권장드립니다.
관련 질문 및 기존의 답변이 또 다른 인사이트를 제공할 수 있을 것으로 예상됩니다.
이 게시물에서 value_counts() 사용에 대한 유사 질문 및 답변을 확인할 수 있습니다. 이처럼 효율적으로 값을 구하는 함수의 활용은 시간이 지나면서 더욱 유익하게 다가올 것입니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
실제시험환경에서 작업형1,2,3의 문제풀이 순서
0
4
1
독립표본검정
0
12
2
tranform을 쓰라는 힌트는 어디서 얻을 수 있나요??
0
14
2
shape 결과에 대한 문의
0
19
2
자료 문의
0
15
1
8 회귀 11번
0
17
2
심화 강의 관련 질문
0
19
2
빈도수 구하는 것 질문
0
16
2
커리큘럼을 따로 인쇄할 수 있는 방법이 있을까요?
0
26
1
작업형2 머신러닝 문제풀이 중 test 데이터 에러 문의
0
29
2
수강연장가능문의
0
31
2
59. 11회 기출 유형 작업형 1 - 문제2 관련
0
26
2
원핫인코딩 슬라이싱 결과
0
23
2
random_state 값이 궁금합니다!
0
29
2
수강기간 연장 가능 여부 문의드립니다
0
48
2
city 컬럼 삭제
0
32
2
3회 기출(작업형 2) 질문 있습니다!!
0
33
1
2유형 탬플릿에 대한 질문입니다
0
47
1
시험환경 질문 드립니다.
0
39
1
수강기간 연장 가능 여부 문의드립니다
0
58
2
문제2-2에서 유의한 변수에서 음수는 유의한지?
0
45
3
강의 만료 후 오프라인 저장 강의 수강 가능 여부
0
51
2
xgboost에 관해
0
54
2
빅데이터분석기사 작업2형
0
59
2

