묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
인코딩, 스케일링, 수치형, 범주형 관련 문의
안녕하세요!시험이 코앞으로 다가온 시점에서...순차적으로 강의를 듣고 있는데데이터 전처리(결측치/이상치 제거) 이후에학습모델에 적용하기 위해수치형 데이터들은 스케일링을, 범주형 데이터들은 인코딩을 해서 train 데이터를 만드는 것으로 이해하였습니다. 그다음 평가(예측)를 위해서 모델에 적용할때ans = (y_test['income'] != '<=50K').astype(int) 와 같이타겟값을 바꿔야하는 경우와평가모델별로 predict, predict_proba 를 사용하는 경우가정해져 있는건지 이 부분이 헷깔립니다 ㅜㅜ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출2 작업형1
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요# your code import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p1/members.csv") df.head(3) df = df.sort_values('views',ascending=False).head(10) df r1 = 9690.0 df.iloc[:10,-1] = r1 cond = df['age'] >=80 print(df[cond]['views'].mean())안녕하세요 10번째 최소값을 r1= 9690.0 으로 지정 후 df.iloc[:10.-1] = r1로 지정후 결과를 냈더니 9690.0으로 나오는데 왜그런걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3
작업3을 위한 원포인트 레슨은 혹시 없을까요? 물론 범위가 광범위하다는 건 알지만, 그래도 혹시:::::
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫 인코딩 시
print(train.shape, test.shape) train = pd.get_dummies(train) test = pd.get_dummies(test) print(train.shape, test.shape)train = pd.get_dummies(train[cols]) test = pd.get_dummies(test[cols])아래처럼 cols로 범주형 칼럼을 인덱싱해서 넣지않고 위처럼해도 되나요? 수치형은 건드리지 않고 범주형에 대해서만 인코딩하기에 cols를 따로 하지 않아도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
로지스틱 회귀분석 범주형변수 인코딩
안녕하세요,예시문제 작업형 3번의 2번 문제 풀이에서 질문있습니다!여기에서 로지스틱회귀 분석을 위해 범주형 변수 중 인코딩이 되지 않은 Gender 변수에 C(Gender)를 붙이셨더라구요혹시 인코딩되지 않은 변수의 앞에 C를 붙이는 것이 필수로 수행되어야하는것일까요?제가 궁금해서 C를 붙이지 않고 모델썸머리를 출력하고 값을 비교해봤는데 모든 표값이 같기는 했습니다.만약, 필수로 C를 붙여주어야한다면 로지스틱회귀분석 뿐만아니라 분산분석(일원/이원)에도 모두 붙여주어야 할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀분석과 분산분석에서 ols
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 헷갈리는 부분이 있어 질문드려요.회귀분석에서 ols사용시는 ols("종속변수~독립변수1+독립변수2+독립변수3"...) 같은 형태로 사용하고다중분산분석 ols에서는 ols("종속변수~독립변수1*독립변수2*독립변수3"...) 이렇게 사용해야하는 것이 맞을까요?회귀분석 : +, 다중분산분석:*
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 제출할때요 질문드려요
마지막에result.to_csv("result.csv",index=False)실행누르고나서 제출만 누르면따로할건없나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험에서 pandas 표준편차 사용이 표준인건가요?
numpy 표준편차랑 pandas표준편차가 다르다고 하셨는데pandas 표준편차가 시험 표준인걸까요?import를 안하고도 사용할 수 있는 numpy 표준편차가 훨씬 접근하기 편해보이는데 왜 pandas로 쓰라고 하시는지 알 수 잇을까요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
전처리 및 피처엔지니어링 단계에서 데이터 분할 관련
전처리 및 피처엔지니어링 단계에서 범주형 컬럼과 수치형 컬럼을 굳이 4개의 데이터로 나누지 않고var1 = ['A', 'B', 'C'] (범주형 컬럼 리스트)var2 =['D', 'E', 'F'] (수치형 컬럼 리스트) from sklearn.preprocessing import MinMaxScaler, LabelEncoder col = train.select_dtypes(exclude='O').columns cols = train.select_dtypes(include='O').columns scaler = MinMaxScaler() train[col] = scaler.fit_transform(train[col]) test[col] = scaler.fit_transform(test[col]) # 범주형 변수 인코딩 for i in cols: le =LabelEncoder() train[i] = le.fit_transform(train[i]) test[i] = le.transform(test[i])이런식으로 해도 될까요? 추가적으로 수치형 데이터의 스케일링은 필수가 아닌가요?(일부 회차에서 수치형 데이터는 스케일링하지 않아서 여쭤봅니다!)
-
해결됨[2025]빅분기 실기! 최신 기출 풀이로 한 방에 합격하기(파이썬)
8회 기출문제 파일
8회 기출문제 파일(.ipynb)은 github에 있지 않은 거 같은데, 어디서 받을 수 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 전처리시 궁금한점
데이터 전처리 강의 내용 중에X_train 데이터와 X_test 데이터의 결측치를 동일하게 채워주라고 말씀해주셨고,X_train의 행삭제는 가능하지만 X_test의 행삭제는 하면 안된다고 말씀해주셨습니다. 이렇게 되면 X_train에서 결측치가 있다고 행삭제를 해버리면X_test에서는 결측치가 있는 행이 그대로 남아있을텐데X_train의 행삭제로 결측치를 해소하는 방법이 어떤 의미가 있는지 이해가 잘 되지 않아 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 5회 1유형 2번문제
2번문제보면 len 말고 sum사용하면 안되나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
표본검정할때!!
표본검정 관련 기출이 없어서 물어봅니다. 혹시,, 정규성이랑, 분산 뭐 이런거 만족한다고했을떄, ttest_1samp, rel, ind 로 풀잖아요,, 근데 정규성이랑 분산만족못하면 비모수 검정까지 하잖아요, 그럼 비모수 검정하고, 다시 ttest 해줘야하는 건가요? 아니면 비모수 검정까지 한 p 값을 적으면 되는 건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
스케일러와 라벨 인코딩 순서
1) 수치형 데이터만 뽑아서 스케일러를 한 후에 범주형 데이터를 라벨인코더하는 것이 맞는지, 2) 아니면 범주형 데이터를 라벨 인코더 하고 전체 데이터를 스케일러를 해도 될지 궁금합니다. minmax말고 standardscaler를 활용하려고 합니다. 3) 또한, scaler할 때는 타겟값인 (y_tr)값을 제외하고 스케일러를 돌려야할지요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 정답 제출할 때
체험환경에서 작업형3 정답을 기록할 때 이전 체험 페이지에서 print한 정답을 확인할 수 없던데, 3개의 소수점 데이터를 외워서 정답에 기록해야 하는건가요? 보통 정답을 기록하는 방식이 있는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
범주형 변수 인코딩 관련 질문입니다
올려주신 코드를 다시 학습하기에는 머리가 너무 복잡해서 ..카테고리가 같더라도 데이터셋을 합친 후 인코딩 실행, 이후 분리해줘도 크게 상관 없죠 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
레이블 인코딩 오류가 떳나 안떳다 해요
이 오류가 뜨는데, 코딩에는 문제가 없어서 앞에서 부터 다시 실행하면 오류 안뜨다가 다시 재 실행하면 뜨다가 합니다... 선생님 해주신 그대로 따라하면서 공부하고 있기 때문에 틀린 부분은 없습니다.또한 똑같은 코딩을 실행해도 어떨땐 되고 어떨땐 안되서 난감합니다. 어떻게 해야 할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 랜덤포레스트 회귀 작업중 워닝 메시지
데이터 결측치 전처리 하는데 이렇게 코드 작업을 했더니 워닝 메시지가 뜨는데시험환경에서도 수정이 필요할까요?# 데이터 전처리 _ 결측치 대체 df['fuel_type'].fillna(df['fuel_type'].mode()[0], inplace = True) df['accident'].fillna(df['accident'].mode()[0], inplace = True) df['clean_title'].fillna(df['clean_title'].mode()[0], inplace = True) [워닝메시지]<ipython-input-37-b2145d16d236>:15: FutureWarning: A value is trying to be set on a copy of a DataFrame or Series through chained assignment using an inplace method. The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy. For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object. df['fuel_type'].fillna(df['fuel_type'].mode()[0], inplace = True)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
predict_proba(test)에서 오류가 나요
혼자 문제를 풀어보고 있는데요 여기서 마지막에 평가할때 pred=rf.predict_proba(test) 에서 계속 오류가 납니다..이렇게 오류가 나는 이유가 뭘까요,,,원래 하던데로 그대로 하고 있는데요ㅠ문제가 roc로 평가하는거라서 predict_proba로 하고 있어요
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 8회 데이터 drop
저는 데이터를 drop하지 않고 그냥 바로 target = train.pop['타켓컬럼']한뒤 바로 train =pd.get_dummies(train)test =pd.get_dummies(test) 를 바로해주는데,, 꼭 id값을 drop 해야하나요? 안하면,, 결과가 많이 안좋나요?