묻고 답해요
156만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
샘플데이터 주소복사...
선생님, input 에서 저렇게 저는 안되던데 ...다른 설정을 해야할까요? 화면도 실제랑 강의랑 좀 달라서 어려움이 있습니다 ㅠㅠ 확인 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
노션 주소 공유가 될까요?
선생님 안녕하세요, 강의 보니까 노션에 정리 해 두셨던데 노션 제 페이지에 저도 저렇게 정리 하려고 하는데 , 혹시 노션링크 받을 수 있을까요? 예전에 보니 본인 페이지를 공유 할수도 있더라고요 ㅎㅎ 캐글 매번 들어와야 하는 번거로움을 줄일 수 있지 않을까 해서 여쭤봅니다~!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[질문사항]데이터 핸들링을 위한 판다스 기초1
안녕하세요 파이썬을 처음 배우고 있는데 데이터 프레임을 생성한 후 type을 확인하는 과정에서 다음과 같은 메시지가 뜨는데 왜뜨는지 이유를 모르겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
복습
선생님 !우선 강의 잘 듣고있습니다.많이 배워지는거 같아요~혹시 수업 듣기전 먼저 문제 풀어보고 수업 들으면서 타이핑은 하고 있는데 한강 듣고 난 후 빈칸 코랩시트지 다시 다운받아서 첨부터 혼자서 타이핑 해보고 다음강으로 넘어가는게 좋을까요? 아님 우선 먼저 빨리 1회독 하는게 좋을까요?제안해주신대로 암기는 일단 차치하고 나아갈 생각입니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 [py] T1-1. 문제에서 답이 다르게 나옵니다
코랩에서 [py] T1-1. 이상치를 찾아라(IQR활용) Expected Questions 문제입니다아래 풀이로 진행했을 때 정답이 다르게 나오는데 혹시 어느 부분에서 차이가 발생한건지 알 수 있을까요?? import pandas as pd df = pd.read_csv("train.csv") # df.info() # df.head() # df.isnull().sum() # IQR을 활용해 Fare컬럼의 이상치를 찾고, # outlier1 = 1q - 1.5 * iqr # outlier2 = 3q + 1.5 * iqr # iqr = 3q - 1q q1 = df["Fare"].quantile(.25) q3 = df["Fare"].quantile(.25) iqr = q3 - q1 # outlier1 = df["Fare"] < (q1 - 1.5 * iqr) # outlier2 = df["Fare"] > (q3 + 1.5 * iqr) q1 - 1.5 * iqr, q3 + 1.5 * iqr outlier1 = df[df["Fare"] < (q1 - 1.5 * iqr)] outlier2 = df[df["Fare"] > (q3 + 1.5 * iqr)] # # 이상치 데이터의 여성 수를 구하시오 len(outlier1["Sex"] == "female") + len(outlier2["Sex"] == "female")
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모의문제 3 - 8번 문제 질문드립니다.
8번 문제 복습 중 궁금증이 생겨서 질문드립니다.1) cond = df.loc[2001] > m2001r1 = sum(cond)cond = df.loc[2003] < m2003r2 = sum(cond)print (r1+r2) 2) r1 = df.loc[2001] > m2001r2 = df.loc[2003] < m2003print (sum(r1+r2))1) 같은 경우는 정답 풀이를 그대로 가져와서 출력 값이 202이고,2) 같은 경우는 제가 다른 방법으로 풀어볼 수 있을까 하는 궁금증에서 적어봤습니다. 출력 값은 202가 아닌 150이 나왔습니다. 둘 다 같은 풀이법 같지만 출력 값이 다른 이유가 궁금해서 질문드립니다 !
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출유형 4회(작업형1)
(문제)date_added가 2018년 1월 이면서 country가 United Kingdom 단독 제작인 데이터의 갯수(풀이4)# 풀이4 import pandas as pd df = pd.read_csv("nf.csv") cond1 = df['country'] == "United Kingdom" df['date_added'] = df['date_added'].fillna("") str1 = "2018" str2 = "January" cond2 = df['date_added'].str.contains(str1) cond3 = df['date_added'].str.contains(str2) print(len(df[cond1 & cond2 & cond3]))이 풀이에서 df['date_added'] = df['date_added'].fillna("")중간에 fillna를 사용한 이유는 무었인가요?빼고 해도 답은 같아서요.다른 필요한 상황이 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험응시전략 🆕 updated 2023.11 노션 자료는 어디에서 확인할 수 있나요??
시험응시전략 🆕 updated 2023.11 노션 자료는 어디에서 확인할 수 있나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
자주 활용되는 판다스 예제 quiz 3
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요quiz 3 데이터 수를 구할 때선생님께서 알려주신 len(df[cond]) 외에df[cond].shape[0] 이나 df[cond].count()[0]을 사용해도 괜찮나요??값은 동일하게 나옵니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 질문드립니다!
안녕하세요!2유형 강의 수강 중 궁금한 점이 생겨서 질문드립니다! IQR 을 사용하여 이상치를 확인 했을 때, 이상치가 전체 행 대비 적게 있을 경우 해당 행 자체를 삭제해도 무방한가요? 스케일링 시, 이상치가 있을 경우 로버스트 스케일링을 사용하는게 좋다라고 하셨는데 이상치가 있는 컬럼에 대해서만 로버스트 스케일링으로 진행하고, 이상치가 없는 컬럼에 대해서는 MinMax 이나 Z-Score 를 사용하여 구분해서 각각 스케일링 하는게 좋은가요? 2-2. 만약 이상치가 없는 경우에도 로버스트 스케일링을 사용할 경우 다른 스케일링 방식에 비해 성능이 떨어지나요? 감사합니다~!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
공부법 질문
퇴근 후 매일 강의를 조금씩 듣고 있습니다.이제서야 작업형 1 강의 목차로 들어왔는데요!저는 강의 들으면서 pause 누르고 타이핑 해보고 저만의 암기노트를 만들면서 시간 있을 때 외우고 있습니다.지금부터 조금씩 외우는 이유는 지금 시간 들여서 강의를 들었는데 쭉쭉 넘어가다보면 (물론 타이핑은 겸하면서) 나중에 또 보면 새로울거 같아서 기억이 있을 때 까먹더라도 외우려고 하고 있긴합니다.다만, 암기를 하니 좀 속도가 더디긴 하네요 ㅠㅠ지금은 암기하지말고 한번 쭉 따라하면서 듣는게 낫나요?저는 문제 풀 때 암기가 되어있지 않으면 안풀리는데 이것은 어떻게 해결하면 될까요?캐글도 풀어야한다고 하셨는데 강의 목차 순서에 있는 것일까요?강의 목록에 있는 것들만 완벽하게 숙지하면 시험에 무리없나요? 추가 사이트 들어가서 공부할 필요 없이 이 강의로만 끝내고 싶어서요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기 강의자료는 어디서 볼 수 있나요?
별도 실기 강의 자료가 있을까요? 인쇄해서 보려구요!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 연장 관련 문의
안녕하세요. 31일 강의가 끝나는데! 혹시 연장이 가능한가요?연장하려면 다시 이 강의를 구입해야 하는지요?ㅜ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
랜덤포레스트 학습시 에러가 납니다.(노트북 블랭크로 연습하던중)
랜덤포레스트로 학습시킬때마다 아래와 같은 에러가 납니다. 어디를 고쳐야할까요?(RandomForest에 random_state 값을 넣어도 똑같았습니다)(모델학습 이전단계에서는 강의와 동일하게 모두 잘 실행되었습니다)아래 검증데이터 분리는 잘된것 사진 첨부했습니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형에서 인코딩한 범주형 변수도 스케일링할 때 넣어줘야 하나요?
안녕하세요. 스케일링에 대해서 여쭤보고 싶은게 있습니다. 스케일링을 진행할 때, 인코딩된 범주형 변수와수치형이지만 범주형 성격을 띄는 변수들도 함께 스케일링을 진행해주어야 하는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
하이퍼파라미터튜닝
random_state, max_depth, n_estimators 같은 하이퍼파라미터튜닝은 모든 회귀, 분류 모델에서 사용가능한가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
테스트 사이즈와 랜덤스테이트
선생님, 실제 시험에서 테스트 사이즈와 랜덤 스테이츠를 입력 해 줘야하나요?사이즈값이나 스테이트값 작성하는 기준은 무엇인가요!?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험시 라이브러리 import관련
시험에서는 따로 라이브러리를 추가할 수 없다고 했던것 같은데... 강의에서 공부를 할때 sklearn 등 라이브러리를 불러오는 코드는 시험에서 따로 작성하면 안되지요?예시 : from sklearn.ensemble import RandomForestClassifier 예시 문장을 시험에서 작성해도 되는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
사후검정에서 '투키'하고 '본페로니' 둘중에 하나만 알아도 될까요?
사후검정을 진행할 때 선생님이 대표적으로 '투키' 하고 '본페로니' 두개를 많이 쓰신다고 하셨었는데.혹시 투키하고 본페로니 둘다 알아야할까요? 아니면 둘중에 하나만 외워도 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시계열 데이터 관련 문의입니다.
기출문제 1번에서는 출동시간과 도착시간이 년월일시분초 다 있어서 datetime에 문제없는데혹시 출동시간 컬럼에 102030 시분초 또는 년월일만 있어도 datetime으로 변경이 가능한가요?만약 변경이 안된다면 변경하는 방법이 궁금합니다.