묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
kruskal 관련
비 모수 검정 시 kruskal 분석 사용해서 p value 값은 어떠한 것을 확인하는 건가요?stats.kruskal(df['A'], df['B'], df['C'], df['D']) 에서 나오는 p value는 어떤걸 의미하는건지 궁금합니다.그리고 해당 p value의 가설 귀무 가정을 알수있을까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출2회와 3회 작업형 2의 차이
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요작업형 2 기출2회 에서는 범주형변수의 컬럼이름만 찾았는데 기출3회에서는 범주형변수와 수치형변수를 분리하는 이유가 무엇인가요?ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수치형 데이터, 범주형 데이터 분리 기준
안녕하세요,수치형 데이터, 범주형 데이터 분리해서 스케일링 및 인코딩을 하셨는데요!수치형 데이터, 범주형 데이터 분리를 할때와 안할때의 차이가 무엇이고, 기준이 무엇일까요? 다시 말씀드리면, 수치형 데이터, 범주형 데이터 분리를 할때와 안할때의 장단점이 궁금하고,어떤 상황에서 분리를 해야하고, 어떤 상황에서 분리를 하지 않아도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제2 질문입니다.
r2 score에 경의 테스트가거의 0.3이하로만 계속 출력되는것으로 강의에서 확인되는데제가 알기로 0.3이하면 굉장히 낮은수준의 모델로 알고있습니다.시험장에서 0.3이하가 나오더라도 제출하는데 문제없을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
csv 파일 만들 때 인코딩 옵션 필요 여부
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요,to_csv로 csv 파일을 만들어서 제출할 때 encoding=‘utf-8’ 옵션을 안넣어도 괜찮을까요?시험문제에서 결과 컬럼명은 항상 영문으로만 출제되나요? (한글로 출제될 때도 인코딩 옵션 따로 안넣어도 되는지 궁금합니다ㅜ)
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1 제출 결과 제출 방법 관련하여
선생님, 작업형 1을 진행하다가 코드로 어떤 방식으로든 문제 풀다가 정답을 알았지만 본 의도대로 코드를 이용해서 print 를 내기가 생각이 안날 때 단순이 그냥 print('정답') 이라는 식으로 print 되게 처리를 하여도 점수를 다 받을 수 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 질문
시험 일주일을 남기고, 벼락치기를 하는 중이라 너무 헷갈려서 질문 남깁니다.어떤 풀이를 보면 수치형데이터만 사용하고, 어떤 풀이를 보면 수치형과 범주형을 각각 train과 test를 나눠서 사용하기도 하고, 또 X_tr,y_tr을 분리해서 사용하는 풀이가 있는 한편 어떤건 그냥 train, test로 사용하기도 하던데 이런것들은 문제에 따라 다르게 사용해야할까요? 아니면 알고있는만큼 작성하는걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
7회 기출 작업형1, 문제 1번 질문입니다.
영상 7분쯤3) 과목 점수 스탠다드 스케일 부분에서 df[["score"]]=scaler.fit_transform(df[["score"]]) 과#데이터프레임 강사님이 작성하신df["score"]=scaler.fit_transform(df[["score"]]) #시리즈 와 같은 결과가 뜨는데 왜 그런걸까요...? 보통 df[cols]=scaler.fit_transform(df[cols])썼던거 같아서요.. 그럼 전자가 맞는 표현 아닌가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글
캐글에서 문제를 풀고자하는데 copy&edit 버튼을 눌러도 위의 형식대로 표시가 됩니다! 어떻게 해결하면 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의고사2
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 시험에서 작업형2문제가 결측값이 있는 문제가 나오면 value_counts()를 통해 가장많이 있는값을 찾아서 fillna() 해주려합니다. train['name'].value_counts() #Hillside Hoteltrain['name'] = train['name'].fillna('Hillside Hotel')test['name'].value_counts() #Brooklyn Apartment test['name'] =test['name'].fillna('Brooklyn Apartment')그런데 train과 test의 value_counts()값이 달라서 train과 test에 다른값(Hillside Hotel 와 Brooklyn Apartment) 을 넣어도 되나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
xgb warning
시험환경에서 XGB는 warning이 뜨는게 맞는거죠?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출4회-시험환경(캐글)
캐글에 시험환경으로 풀어보기로 풀어보려하는데 shift+enter로 실행이 원래 안되는걸까요? 그리고 df.head()를 해도 아래 출력이 안됩니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
소수점 버림, 올림, 부분 문자 일치 질문입니다.
기출유형 4회 작업형 1 관련 1번 문제소수점을 버려 정수형으로 표현을 할 때 소수점을 버리거나 올리는 함수(예 : round)와 같은 함수가 있나요? 마지막답인 경우엔 int로 쓰면 될 것은데 혹시나 목록에 있는 데이터를 수정할 때 쓸수 있는 방법이 궁금합니다.3번 문제 United Kingdom 단독을 찾으라고 하였는데 문제에서는 United Kingdom 만 나와 있는데 country가 만일 United Kingdom & Korea와 같이 공동 제작이 섞여 있다면 조건을 어떻게 주어야 하나요? 일치하는 문자(==가 아니라 일부 일치하는 것 찾는 조건)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경 코드 실행 방법
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요시험환경에서 실행 버튼을 눌러야 코딩이 실행되나요? Colab, 쥬피터 노트북에서 shift+ enter로 코드를 실행했었는데 시험환경에서는 실행이 되지 않네요. 시험 환경에서 코드 실행 방법이 불편해서 혹시 다른 방식이 있나 여쭤봅니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
fit_transform 관련 질문
from sklearn.preprocessing import MinMaxScaler mms = MinMaxScaler() df['co'] = mms.fit_transform(df[['co']])MinMaxScaler에서 fit_transform에 [] 를 두번 쓰는 이유가 무엇인가요?강의에서는 문법이라 외워야되는 것처럼 이야기하셨는데 그냥 문법 만든 사람이 저렇게 쓰도록 해서 그런 건가요?시험에 쓰는 함수 중에 저런 특이한 것들이 더 있나요? [], (), [[]] 쓰는 게 헷갈리는데 쉽게 외울 수 있는 기준이나 공식이 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
최종모델 확률값 소수점 범위 다른 경우
최종 모델의 확률 값의 소수점 자리수가 다른경우는 어떻게 해야할까요..?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
최종 모델 선택 후, 같은 조건으로 validation까지 학습해도 되나요?
안녕하세요, 강의 듣던 중 궁금한 점이 생겨 질문드립니다 !강의에서 모델링 및 평가를 할 때 보면 순서가피처 엔지니어링여러 회귀/분류 모델 학습 성능 평가위의 세 단계를 반복하며 제일 성능이 좋은 조건과 모델을 선택하는 것으로 이해했습니다. 위의 과정을 통해 성능 좋은 모델과, 피처 엔지니어링 방법을 알았다면, 검증 데이터로 나눈 것을 다시 학습 데이터로 합쳐서 해당 모델과 조건으로 다시 학습 시켜서 제출하는 방법이 가능한가요?더 많은 데이터셋으로 학습하는 것이 좋지 않을까 하여 질문 드렸습니다 !
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1, 3 제출방식
선생님 실제 시험환경에서 제출방식에 대한 질문이 있습니다.7회차부터 답안 제출 방식이 바뀌었다고 들었습니다. 작업형1, 3유형에서 (풀이용) 코드는 따로 제출하지 않고 풀이만 해서 저장하고(답안제출)에서 답만 제출하면 되는건가요?? 그렇다면 실제로 (풀이용) 탭에서 작성한 코드에 대해서는 따로 채점을 하지 않는다는 걸까요? 실제 체험환경과 강의에 올려주신 9회 응시가이드 화면이 달라서 문의드립니다. <응시가이드> <체험환경>
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
인코딩 및 ensemble 관련 문의사항입니다.
LabelEncoder를 해도 되고 원핫 인코딩을 해도 아무 상관이 없나요예를 들면 기출 6 작업형 2에 LabelEncoder를 쓰니 성능이 잘 나오는데 성능이 잘 나오는 것으로 쓰면 되는 지요그리고 작업형 어떤 ensemble을 쓰던 적당한 값이 나오면 40점을 받을 수 있는 것인가요?metrics으로 자체 확인을 하지 않고 내더라도 낸 결과가 적당한 결과이면 점수를 받는 것인가요?순전히 시험 점수 측면 획득 측면에서 여쭤 봅니다. 시험이 아니라면 이것 저것 해보겠지만 시험에서는 실수하는 것보다 단순하게 하는 것이 좋을 것 같습니다. 보통 RandomForest로 해도 적당한 결과가 나오는데 과거 기출 기준에서는 validation 예측/비교 없이(생략하고) 1~2개의 기법으로 test값만 예측해도 되는 것인지요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4회 기출유형 작업형 1
2번 문제를 len이 아니라 result_count = sum(cond1 & cond2 & cond3) print(result_count) 이런 방법으로 풀어도 될까요?