저서:
2025 시나공 빅데이터분석기사 실기 (길벗)
파이썬 딥러닝 텐서플로 (정보문화사)
유튜브: https://www.youtube.com/@ai-study
Courses
Reviews
- [After-work activities] Big Data Analysis Engineer Practical (Work-type 1,2,3)
- [After-work activities] Big Data Analysis Engineer Practical (Work-type 1,2,3)
- [After-work activities] Big Data Analysis Engineer Practical (Work-type 1,2,3)
- [After-work activities] Big Data Analysis Engineer Practical (Work-type 1,2,3)
- [After-work activities] Big Data Analysis Engineer Practical (Work-type 1,2,3)
Posts
Q&A
모델링및평가(분류) 17:30초 지점 질문드립니다.
검증용 데이터 분리는 문제1에도 적용가능합니다.각각 별개로 봐주세요! 문제1. train 전체데이터 학습 후 정답지(y_test)로 평가함 (시험에서는 이렇게 학습은 가능하나 y_test가 없기 때문에 평가할 수 없음)문제2. train 에서 검증 데이터 분리후 검증 데이터로 평가함 (시험에서 평가 가능한 방법) 입니다.
- 0
- 2
- 48
Q&A
데이터 분리하기 문의드립니다.
주어진 데이터를 합쳤다가 분리를 진행했어요train과 test를 합쳤는데 이때 train에는 income데이터가 있고test에는 income 데이터가 없다보니합쳤다가 분리하면 test에 income 컬럼이 생기게 됩니다 (모두 결측치) 이에 해당 컬럼을 삭제할 필요가 있어 삭제했어요!
- 0
- 2
- 47
Q&A
종자와 비료의 p밸류값
P-값이 작다는 건 그 변수가 토마토 수에 영향을 준다는 증거가 강하다는 뜻이에요.하지만 "얼마나 많이 영향을 주는지"를 나타내는 건 아니에요.영향을 비교하려면 회귀 계수를 확인합니다.
- 0
- 2
- 23
Q&A
가독성을 높이는 임시변수명 정하는 방법 문의
제가 a라는 변수명을 사용한 것은시험에서 특정 회차에서 a라는 변수명으로 데이터를 불러왔기 때문이에요!본 강의는 시험을 위한 강의이고 시험의 흐름을 최대한 반영하고 있어요! 변수명에 의미가 필요하다면 민균님이 필요한 대로 변경해서 사용하면 됩니다. a 가 아닌 df, b, c, d 상관없습니다.
- 0
- 3
- 45
Q&A
cols 변수 문의 드립니다.
6분 지점에 cols는 리스트를 담은 변수 입니다.구분이 필요하다면 변수명을 cols_list 등으로 자유롭게 사용하면 됩니다.
- 0
- 3
- 48
Q&A
cond에 대한 개념 정리를 부탁드립니다.
안녕하세요!이렇게 의문이 들때는 cond를 출력해보면 됩니다.print(cond)결과를 살펴보면 True False로 저장되어 있어요. 즉 조건이 참이면 True, 거짓이면 False 입니다. cond = a['target']==0a['target']이 0인 조건문의 결과를 cond라는 변수에 대입한 상황이에요
- 0
- 2
- 40
Q&A
CV error
오!! 크로스 밸리데이션까지 🙂 멋집니다.확인 방법 공유해요!# 사용 가능한 scoring 목록 출력 from sklearn.metrics import get_scorer_names print(get_scorer_names()) > ['accuracy', 'adjusted_mutual_info_score', 'adjusted_rand_score', 'average_precision', 'balanced_accuracy', 'completeness_score', 'd2_absolute_error_score', 'explained_variance', 'f1', 'f1_macro', 'f1_micro', 'f1_samples', 'f1_weighted', 'fowlkes_mallows_score', 'homogeneity_score', 'jaccard', 'jaccard_macro', 'jaccard_micro', 'jaccard_samples', 'jaccard_weighted', 'matthews_corrcoef', 'max_error', 'mutual_info_score', 'neg_brier_score', 'neg_log_loss', 'neg_mean_absolute_error', 'neg_mean_absolute_percentage_error', 'neg_mean_gamma_deviance', 'neg_mean_poisson_deviance', 'neg_mean_squared_error', 'neg_mean_squared_log_error', 'neg_median_absolute_error', 'neg_negative_likelihood_ratio', 'neg_root_mean_squared_error', 'neg_root_mean_squared_log_error', 'normalized_mutual_info_score', 'positive_likelihood_ratio', 'precision', 'precision_macro', 'precision_micro', 'precision_samples', 'precision_weighted', 'r2', 'rand_score', 'recall', 'recall_macro', 'recall_micro', 'recall_samples', 'recall_weighted', 'roc_auc', 'roc_auc_ovo', 'roc_auc_ovo_weighted', 'roc_auc_ovr', 'roc_auc_ovr_weighted', 'top_k_accuracy', 'v_measure_score']
- 0
- 2
- 26
Q&A
XGBClassifier 사용 에러
xgb 모델 학습시 레이블이 반드시 0부터 시작해야 하며 이진 분류일 때는 0, 1다중 분류일 때는 0, 1, 2... 로 되어야 합니다. xgb 모델은 다른 모델과 달리 예민해요!따라서 시험 때는 xgb 모델 보다는 랜덤포레스트 또는 lightgbm 을 추천합니다. 응원합니다 🙂
- 0
- 3
- 38
Q&A
Print 코드
아니요 사용하지 않아도 됩니다.다만 print()를 통해 눈으로 확인하면서 코딩하는 방법을 추천해요!
- 0
- 2
- 16
Q&A
Timedelta 질문입니다
100일째까지 포함하려면 → days=99100일 이후부터를 포함하려면 → days=100
- 0
- 2
- 24