묻고 답해요
160만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제3
강의에서 xgb로 test데이터를 predict하셨는데 성능평가가 더 우세해서 선정하신건지 궁금합니다!수업 자료 노트북에선 랜덤 포레스트가 지표가 더 높더라구요 ㅠㅠ 랜덤 포레스트: roc-auc: 0.9409937888198757 accuracy: 0.8108108108108109 f1: 0.8444444444444444 xgb roc-auc: 0.9161490683229814 accuracy: 0.8108108108108109f1: 0.8372093023255814
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
1-3 문제 관련
1-3 관련 내용입니다. print(a.sort_values(ascending=False).index[0])이라는 동일한 코드를 사용했는데 오류 메시지가 발생하더라구요...TypeError: DataFrame.sort_values() missing 1 required positional argument: 'by'이라는 에러 메시지가 발생하였습니다. 이런 경우는 어떤 경우일까요....?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이진분류
문제 2유형 질문드립니다 4회부턴 분류 회귀 이렇게 나와서 코드를 외우는 중인데요 2~3회는 이진분류로 나와서요 2진분류는 많이 다른건가요
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모의문제 2번
train 데이터에서 id컬럼을 삭제하신 이유가 뭔가요? 이런 비슷한 유형의 문제에서 name이나 host_id같은 결과 값에 영향을 주지 않을 거 같은 컬럼은 삭제해도 무관한가요? 인코딩에서 neighbourhood 컬럼이 train과 test 의 카테고리와 개수가 다 다른데 데이터를 합치지 않아도 되나요? 그럼 concat함수를 꼭 사용해야 하는 경우는 어떤 경우인가요?
-
미해결파이썬으로 시작하는 머신러닝+딥러닝(sklearn을 이용한 머신러닝부터 TensorFlow, Keras를 이용한 딥러닝 개발까지)
Boston 데이터 어디서 받나요?
기존 질문글들에 있는 링크나 인프런에서 제공하는 무능한 AI 챗봇 링크를 봐도 데이터가 없던데 어디서 다운받는지 알려주시면 감사드릴게요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
전처리 방법
작업형 3의 문제## 심장마비 확률이 높은사람? - 성별, 나이, 혈압, 콜레스테롤, 공복혈당, 최대 심박수 등의 컬럼이 있음 - 평가: ROC-AUC, 정확도(Accuracy), F1 을 구하시오 - target : output (1:심장마비 확률 높음, 0:심장마비 확률 낮음) - csv파일 생성 : 수험번호.csv (예시 아래 참조) ~~~ 위와 같은 문제가 실제 시험 환경에서 문제 양식과 비슷한가요? 저렇게 문제가 나오면 전처리를 어떻게 해야 하는지... 궁금합니다. 만약, 시험 환경 문제가 저렇게 나온다면..결측치 제거를 그냥 컬럼을 보고 아무 컬럼이나 제거를 해도 되는지. 그게 채점 규정에 맞을지. 그리고 결측치 제거시, fillna()를 쓰는데 아무 값이나 넣어도 되는지. fillna(method='bfill') 이런걸 써도 되는지. 이상치 제거도 그냥 이것도 임의로 뭔가 이상치 인거 같다 싶으면 제거 하는건지..이게 채점 규정에 맞을지... 애매 한거 같은데요. ============그리고 혹시나 시험 유형이 저렇게 안나온다면,문제를 좀 더 명확하게 서술 해주셔야 할 거 같아요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩 후 컬럼 개수 불일
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 print(train.info()) print(test.info()) print(train.isnull().sum()) print(test.isnull().sum()) print(train.head()) print(test.head()) target = train['총가스사용량'].pop # import sklearn # print(sklearn.__all__) print(train.shape, test.shape) train = pd.get_dummies(train) test = pd.get_dummies(test) print(train.shape, test.shape)상기 처럼 코딩 후,컬럼값이 26, 25로 불일치하게 나와요. 왜일까요...(3196, 6) (1476, 5) (3196, 26) (1476, 25)그래서 그 이후 값들도 에러가 떠요 from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state = 0)--------------------------------------------------------------------------- TypeError Traceback (most recent call last) /tmp/ipython-input-3028840780.py in <cell line: 0>() 1 from sklearn.model_selection import train_test_split 2 ----> 3 X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state = 0) 4 frames/usr/local/lib/python3.12/dist-packages/sklearn/utils/validation.py in _num_samples(x) 397 if hasattr(x, "shape") and x.shape is not None: 398 if len(x.shape) == 0: --> 399 raise TypeError( 400 "Input should have at least 1 dimension i.e. satisfy " 401 f"`len(x.shape) > 0`, got scalar `{x!r}` instead." TypeError: Input should have at least 1 dimension i.e. satisfy `len(x.shape) > 0`, got scalar `array(<bound method Series.pop of 0 9077.8 1 10105.5 2 8603.6 3 11076.8 4 10781.4 ... 3191 12294.7 3192 10410.7 3193 10473.8 3194 9657.9 3195 9961.5 Name: 총가스사용량, Length: 3196, dtype: float64>, dtype=object)` instead.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제2
안녕하세요 혹시 문제에서는 전처리시에 열을 삭제하고, cols = ['name', 'host_name', 'last_review', 'host_id']열을 삭제하고, 값이 비어 있는거 train['reviews_per_month'] = train['reviews_per_month'].fillna(0) test['reviews_per_month'] = test['reviews_per_month'].fillna(0) 이렇게 채우는게 문제에서 지시 사항이 없었는데, 작업을 해도 되는건가요?명확한 지시 사항이 있어야 하는게 아닌가 싶어서 여쭤봅니다.시험 환경에서 저렇게 데이터를 삭제하거나 이상치를 처리 하는거 결측치 처리를 임의로 해도 되는지 궁금합니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2-모의문제 1번 검증 데이터 분리
from sklearn.model_selection import train_test_splitX_tr, X_val, y_tr, y_val = train_test_split( train.drop('Attrition_Flag', axis=1), train['Attrition_Flag'], test_size=0.2, random_state=2022 )선생님, 데이터 분리 작성할 떄, train.drop('Attrition_Flag', axis=1) 이 부분이 이해가 가지 않아요.Attrition_Flag 컬럼은 pop함수로 따로 빼놓는거로 알고 있는데, 여기서 왜 drop으로 삭제를 하고, 뒤에 train['Attrition_Flag']를 다시 넣는건지 모르겠어요.. + 데이터 분리 전에, 먼저 target에 Attrition_Flag를 따로 분리시켜놓고 split함수를 작성해도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2에서 결측치 처리
결측치를 삭제할지, 결측치를 채울지는 본인이 선택하면 되는걸까요?결측치 삭제할때 행, 열 , 특정 열 삭제 중 뭘 선택해야할지 좀 복잡해보여서그냥 결측치를 채우는 방식으로 하고싶은데 결과값이 많이 달라질까 궁금합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의고사 데이터파일 오류
안녕하세요.다름이 아니라 작업형1 모의문제를 풀고자 데이터를 다운 받았는데 사진과 같이 데이터에 오류가 생기는데혹시 어떻게 해결할 수 있을까요? 노트북으로 다운 받았는데 오류가 생기길래 폰으로 다운을 받고 노트북으로 옮겼더니 또 오류가 생겼으며 메일을 통하여 다운받아도 똑같이 오류가 나네요ㅠㅠ 혹시 엑셀 버전 차이 때문일까요?
-
해결됨코드 5줄의 마법, 5줄 머신러닝 PyCaret: 데이터 분석 프로젝트에 AutoML 날개 달기
13강 질문
안녕하세요, 13강에서 2개 질문 있습니다.ch =1로 레이블 되어있던데, shap값이 높으면 음수가 되니까 loyalch가 높을 수록 0으로 분류하는 것 아닌가요? 아래 코드에서 오류가 나는데 어떻게 수정해야 하나요?print("\n--- 4. Local Interpretation (SHAP Reason Plot) ---") interpret_model(tuned_lgbm, plot='reason', observation=0)
-
미해결[왕초보] [누적 5,000명+] Python 프로그래밍 기초 완성 로드맵
for-else는 언제 쓰나요?
안녕하세요. for-else는 언제 쓰나요? 궁금합니다.답변 감사합니다.
-
해결됨[왕초보] [누적 5,000명+] Python 프로그래밍 기초 완성 로드맵
요즘 바이브코딩이 대세인데 파이썬을 배워야하는 이유가 뭘까요?
열심히 수강중인 학생입니다.좋은 강의 정말 감사합니다. 개인적으로 궁금하여 문의드립니다. 요즘 바이브코딩이 대세인데 파이썬을 배워야하는 이유가 뭘까요?
-
해결됨[왕초보] [누적 5,000명+] Python 프로그래밍 기초 완성 로드맵
코드에서 오류를 찾는 팁이 있을까요?
코드에서 오류를 찾는 팁이 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코딩 내용이 같이 출력됨
코딩을 하던 중 위와 같이 결과 창에 코딩 내용? 같은 문자들이 같이 출력됩니다.비슷한 경우가 종종 발생하는데 어떻게 해결할 수 있나요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
14강 강의 듣는중에 궁금한게 있어서 질문합니다~
안녕하세요~ 좋은 강의 잘 듣고 있습니다.넘파이 ndarray 인데싱(indexing) 이해 - 단일값과 슬라이싱 인덱싱 수업을 듣는중 궁금한게 있어서 질문합니다.해당 강의 8분 50초 정도에서 array2d[ 1:3, 0:3 ] 과 array2d[ 1:3, : ] 예시가 이해가 안되서요제가 이해한건 : 앞은 시작 인덱싱 값이고 : 뒤는 가져올 값의 범위 즉 갯수로 이해했는데요그러면 array2d(3, 3) 의 2차원 ndarray 이면 axio0의 1:3 인덱싱이 범위를 벗어나는거 아닌가해서요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
선생님, 강의 연장 관련하여 문의드립니다..
안녕하세요, 선생님. 강의 잘 듣고 있는 재직자입니다.저번 시험부터 준비하려고 했지만, 프로젝트가 겹쳐서 마지막 시험인 이번 회차까지 넘어오게 되었네요...수강 기간이 11월 1일까지인데, 혹시 이번 시험인 11월 말까지만 강의 연장이 가능한지 여쭤보고 싶습니다.마지막 기회인만큼 정말 열심히 하겠습니다..!답변 기다리고 있겠습니다. 감사합니다! 제 이메일은 (areuwho112@gmail.com) 입니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강기한 연장 문의
혹시 수강기한을 시험날까지 연장할 수 있을까요? 어떻게 하면 될 지 도움 부탁드립니다.감사합니다,
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실제시험 본 이후에 가채점 가능한가요?
안녕하세요 이번 11월29일에 처음 시험을 보는데,작업형1과 3의 답을 수험표에 적어올수있을것 같은데혹시 강사님이 모범답안을 올려주시나요?미리 가채점을 할수있으면 좋을것 같아서 질문드립니다.