묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시계열 데이터 type 질문
dtype : datetime64[ns] 에서64랑 ns는 무엇을 의미하나요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩 질문
강의에 알려주신대로 따라서 하고 있는데 원핫인코딩 결과에 income category랑 card category만 뜨고 나머지 object컬럼(gender 등)은 뜨질 않습니다.. 뭐가 문제인지 알려주실 수 있을까요? #baseline(object컬럼 제거) cols = train.select_dtypes(include='object').columns # print(train.shape, test.shape) # train = train.drop(cols, axis=1) # test = test.drop(cols,axis=1) # print(train.shape, test.shape) # 라벨인코딩 # from sklearn.preprocessing import LabelEncoder # for col in cols: # le = LabelEncoder() # train[col] = le.fit_transform(train[col]) # test[col] = le.transform(test[col]) # train.head() # onehot 인코딩 pd.get_dummies(train, columns=cols)마지막에 8101 rows × 39 columns 라고 뜨는데 그냥 표시만 안 된건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수치형 데이터 스케일링
기출5회 작업형 2번 수치형 데이터 스케일링은 필요없나요? 언제 스케일링을 해야하는지 잘 모르겠어요..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1번 모의문제 2 질문드립니다
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요소수점 나이를 제거할 때cond = df['age'] == round(df['age'],0) 이 코드로 반올림한 값과 age가 같은 것을 조건으로 걸었는데요 소수점 자리0.5미만인 애들은 제거가 안되지 않았을가요?예시:32 와 32.3 반올림한 값을 비교해도 같다고 나옴
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
함수 오적용 시 데이터 변경되었을 때, 원복 문의
변수 지정을 잘못 하여, 가격 프레임의 데이터가 완전 바뀌었는데다시 이전 데이터로 원복하려면 어떻게 해야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
퀴즈 1번 문의
min_price 변수 지정없이 바로df['이벤트가'].fillna(df['이벤트가'].min())로 사용하면 안되던데, 왜그런 건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
함수별 ()와 [] 구분
함수별로 어떤것은 ()를 사용하고, 어떤것은 []를 사용하는데구분하는 법이 따로 있나요? 매번 헷갈리네요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
알듯말듯하네요
앞에 띄어쓰기도 없고, 몇번을 해봐도 시즌 컬럼이 드랍이 안됩니다.. ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
df.mode()에서 []의 의미
20:14초에서 df['원두'].mode() [0]에서[0] 의 의미가 무엇인가요? [] 안에 다른 숫자를 넣어도 되는가요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
smote = SMOTE(random_state=0)
안녕하세요 선생님 !분류에서 샘플링 기법을 배웠는데from imblearn.over_sampling import SMOTEsmote = SMOTE(random_state=0) 회귀문제에서도 smote 기법같은게 있을까요 ?!강의 교육 전 먼저 질문드립니다 ㅠ..!
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
인코딩문의
ㅅ선생님 이전 8회 실기준비할 때 보면대부분 원-핫 인코딩으로 하는 분위기였는데이번에도 그렇게 준비해도 충분 하겠죠? 뭐랄까 Label Encoder는 실전에서 코드가 생각 잘 안나기도 하고 그래서요 ㅠㅠ 타겟값 옮겨겨놓기target = train.pop('total') # 원핫 인코딩 train = pd.get_dummies(train)test = pd.get_dummies(test) # 데이터 분할을 해보자 from sklearn.model_selection import train_test_splitX_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0) # 랜포에 넣어보자 from sklearn.ensemble import RandomForestRegressorrf = RandomForestRegresosr(random_state=0)rf.fit(X_tr, y_tr)pred = rf.predict(X_val) # 제출 해보자 pred = rf.predict(test)submit = pd.DataFrame({'pred': pred}) 이렇게만 해서 40점은 받긴 했는데... (저번에 1유형 0점맞아서 재수 중..ㅠㅠ) submit.to_csv("result.csv", Index=False)
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
분류카드 실습
안녕하세요 위와 같이 코드를 실행하면 아래와 같이 에러가 뜨네요 ㅠ 집에선 잘됬던거 같은데회사에서 똑같이 하니 왜그런건지 ..!..ㅠ
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
15:54초 코드 설명창 문의
15:54초에서 해당 코드 설명이 나와 있는 것 같은데, 저는 설명창이 나오지 않는데 어떻게 하면 설명을 확인할 수 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
df.head()와 df 차이점 문의
df.head()와 df 입력시 차이점이 어떤것인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1 첫번째 문제풀이 및 실기대비
csv 파일을 주어졌으니,import pandas as pddf=pd.read_csv여기까지는 뜻도 모르고 기계적으로 따라하기는 했습니다. print(df)한 셀만 이용하라고 하셔서 내용도 궁금하니 확인할 겸 print문을 썼습니다. . f1 컬럼의 결측치를 중앙값으로 대체df.isnull().sum()을 통해 df에 결측치가 있다는 사실을 이해했는데,df['f1']=df['f1'].fillna()와 같은 형태로 채우기는 해야하는데.. 중앙값 (median 맞나요??) 코딩을 어떻게 응용해야 할 지 모르겠습니다. . 나머지 결측치가 있는 데이터(행) 모두 제거. 앞에서부터 70% 데이터 중 view 컬럼의 3사분위수에서 1사분위수를 뺀 값 계산 궁극적으로 첫번째 문제 때 부터 문제를 읽다가 난독(?) 증상이 와서어떤 코딩을 어떻게 적용 또는 응용해야 할 지를 몰라서 도무지 갈피가 잡히지 않습니다. 비슷한 고민이나 어려움을 겪어보셨던 분들 조언해주시면 좋겠습니다.필기합격 유효기간도 얼마 남지 않아서 실기를 꼭 따고싶어서 인터넷 동영상 강의를 들으며 따라해볼 때는 자신감이 붙는 것 같은데, 막상 모의문제 코딩 풀이를 하려니 마음만 앞서고 몸은 전혀 따라주지 않네요...그냥 처음 몇 번은 고민해봤자 생각이 안되니 코딩 방법이라도 외우든 요령을 틔워야만 할 수 밖에 없는지.. 정말로 갈피가 잡히지 않습니다.문제 읽고 이해를 못해서.. 문제를 읽고 적합한 코딩을 어떻게 응용해야 할 지 몰라 실기 0점만 주구장창 받으면 스트레스만 쌓이지 않겠습니까?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제 1-2 gold값 가진 데이터 수
gold값을 가진 데이터 수를 구할 때 아래의 코드처럼 조건문 대신 .str과 .sum을 사용해도 괜찮은 건가요?print(df['f3'].str.contains('gold').sum())
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩 시 표출 오류 및 컬럼수 불일치
아래와 같이, 수업에서 나온 코드 동일하게 작성했습니다.# 원핫 인코딩n_train, n_test, c_train, c_test = get_nc_data() # 데이터 새로 불러오기display(c_train.head())c_train=pd.get_dummies(c_train[cols])c_test=pd.get_dummies(c_test[cols])display(c_train.head())그러나 원핫 인코딩에서 강의처럼 코드 표출이 안 됩니다. -> true , false로 표출됩니다. 또한, 컬럼 수도 99개로 1개 모자랍니다. 무엇이 오류일까요..?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩
기출 3회 작업 2유형에 원핫 인코딩을 하면 0/1로 변환이 되는 것이 아니라 True/False 로 변환이 되는데.. 이유가 뭘까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
중복값이 있는 데이터 생성 'car' 부분
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요계속해서 오류가 뜨는데 이유를 모르겠습니다 ㅜㅜ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
OneHotEncoder()와 get_dummies() 차이가 있는지요
OneHotEncoder()가 좀 더 쓰기 편한 것처럼 느껴지는, 빅분기 시험 준비에서는 get_dummies()를 사용하는 예가 더 많이 보이는 것 같습니다. get_dummies()를 더 많이 사용하는 이유가 어떻게 되는지요?