묻고 답해요
169만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
자동완성기능 해제 관련해서 문의드립니다 ㅠㅠ
주피터로 학습초반에 환경을 잘못 건드린것 같은데 회색 글씨 없애는 방법이 있을까요..?? 코드 치면서 나오는 도움 박스도 없애고 싶습니다....
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 1~5까지의 작업형 3
은 왜 없나요 ??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
레이블 인코더를 함수써서 작성했는데요 마지막에 score점수가 나온거면 문제없이 코드작성 된걸까요? 저 코드가 맞는지 ...(작성하고도 자신이 없네요)
#고급모델링 import pandas as pd train=pd.read_csv("train.csv") test=pd.read_csv("test.csv") #범주형데이터의 컬럼들만 가져오기 cols=train.select_dtypes(include="O").columns #이번에는 레이블인코딩해보기 from sklearn.preprocessing import LabelEncoder le =LabelEncoder() for col in cols: train[col] = le.fit_transform(train[col]) test[col] = le.transform(test[col]) target=train.pop('Segmentation') train= train.drop("ID",axis=1) test_ID = test.pop("ID") from sklearn.ensemble import RandomForestClassifier model = RandomForestClassifier(max_depth=9, random_state=2022) #교차검증 from sklearn.model_selection import cross_val_score score=cross_val_score(model, train, target, scoring='f1_macro',cv=5) print(score) [0.52381264 0.51261137 0.52051415 0.53607741 0.51389807]
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모의고사 1-3 결과값 smoothness error 문의
smoothness error 면 제대로 된 결과값이 안 뜬거 아닌가요? 강의 결과값에도 똑같이 나와있어서 문의드립니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결과가 1로 나오는데 어디가 잘못된걸까요
target = train.pop('output')from sklearn.preprocessing import MinMaxScalersc = MinMaxScaler()train = sc.fit_transform(train)test = sc.transform(test)from sklearn.model_selection import train_test_splitx_tr, x_val, y_tr, y_val = train_test_split(train, target, test_size = 0.2 , random_state =5)# print(x_tr.shape, x_val.shape, y_tr.shape, y_val.shape)from sklearn.ensemble import RandomForestClassifierrf = RandomForestClassifier(random_state=5, max_depth = 5)rf.fit(x_tr, y_tr)pred1 = rf.predict(x_val)pred2 = rf.predict_proba(x_val)from sklearn.metrics import roc_auc_score, f1_scoreroc_auc_score = roc_auc_score(y_val, pred2[:,1])f1_score = f1_score(y_val, pred1)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
copy()
copy()함수를 사용하면 좋은 점?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제3 문제8 오류발생
선생님과 코드를 동일하게 작성하였는데, groupby부분을 실행하면 첨부한 사진과 같은 형식으로 결과값이 나옵니다.문제해결 도와주시면 감사하겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출문제 8회 2유형 관련 문의
안녕하세요.프로그램에 대한 지식이 없다보니 이것저것 내용을 보고 판단해서 작성한건데, 이렇게 하면 크게 문제가 없을까 싶어서 문의 드립니다. #1. 데이터불러오기import pandas as pdtrain = pd.read_csv(r'C:\Users\user\Desktop\빅데이터분석기사 실기\8회\train.csv')test = pd.read_csv(r'C:\Users\user\Desktop\빅데이터분석기사 실기\8회\test.csv')#customerID, TotalCharges#불필요 삭제train = train.drop('customerID', axis=1)test_ID = test.pop('customerID')#타켓 지정target = train.pop('TotalCharges')#원핫 라벨링train = pd.get_dummies(train)test = pd.get_dummies(test)이후데이터분리데이터학습데이터검증
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제 5번 IQR 관련 문제
import pandas as pd df=pd.read_csv('members.csv') q3 = df['views'].quantile(0.75) q1= df['views'].quantile(0.25) IQR=q3-q1 cond = (df['views']<q1-1.5*IQR)|(df['views']>q3+1.5*IQR) print(sum(cond)) 스스로 풀었을 때 이렇게 적었는데, or로 엮어서 합계를 구해도 각 조건 마다 카운트 해서 값을 정확히 내는 게 맞을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
컬럼 생략 ..?
id나 subscribed 컬럼은 어떻게해서 생략이 됐나요 ??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
object type 문제 다른 풀이 확인
#모의문제 2 - 내가 푼 것 import pandas as pd df=pd.read_csv('members.csv') #print(df.info()) cond=df.dtypes=='object' #print(df.shape) df=df.drop(df.columns[cond],axis=1) df=df.fillna(0) #print(df.shape) #print(df.info()) cond2=df.sum(axis=1)>3000 print(len(df[cond2])) 이렇게 해도 정답 73으로 동일한데, 이렇게 풀어도 되는지 여쭙고싶습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
age 결측치 및 이상치 처리 순서
age 컬럼의 결측치를 채운 후 이상치를 처리하는 순서로 진행이 되는 코드로 이해했습니다.그런데, age 컬럼의 이상치가 음수, 소수, 0 등으로 이상치 처리 전 결측치를 채우기 위해 평균(mean)값을 먼저 구한다면, 이상치가 평균값에 영향을 끼쳐 결측치 채움(대입)에 문제가 있지 않을까 생각이 되는데, 결측치 및 이상치의 전처리 순서를 바꾸어 이상치 처리를 먼저 하는 것은 어떨까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
오류가 나는데 왜그런걸까요 ? 똑같이 타이핑했거든요 ㅠ
#중급단계 #목표 : 범주형 카테고리 데이터 활용하기 import pandas as pd train=pd.read_csv("train.csv") test=pd.read_csv("test.csv") #원핫?레이블인코딩? #EDA train.shape #범주형데이터를 원핫인코딩해보기 train.describe(include="O") test.describe(include="O") train=pd.get_dummies(train) test=pd.get_dummies(test) target=train.pop('Segmentation') test_ID = test.pop("ID") from sklearn.ensemble import RandomForestClassifier model = RandomForestClassifier(max_depth=9, random_state=2022) model.fit(train,target) pred = model.predict(test) pred
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
베이직과 중급단계 분석까지 왜 데이터분할검증은 하지 않는것일까요?
바로 모델학습 예측을 하시는데 데이터분할검증 과정은 왜 안하셨는지 이유가 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제 1의 문제2번 질문
문제 2번에서 isnull()로 결측치를 계산해 보니 f1 컬럼이 결측치가 30% 이상이었습니다. 이때 결측치가 30% 이상인 컬럼을 df.columns[...]로 변수에 저장해서 사용하는 것보다, 컬럼 이름 f1을 직접 코드에 넣는 방식이 더 적절한 건가요? 실무에서는 어떤 방식이 더 많이 쓰이는지도 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
train과 test object 유형 또는 갯수가 다르게 되면 어떤 처리가 필요한가요?
안녕하세요. train과 test object 유형 또는 갯수가 다르게 되면 어떤 처리가 필요한가요? train.describe(include=object), test.describe(include=object) 프린트해서 보면 개수가 같은지 보고 있는데요. 1.다른 경우는 어떻게 해야하는지, 2.아니면 범주 자체가 다른데 갯수만 똑같으면 상관없는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
검증데이터 분리
위에가 영상 속 코드고 밑에가 제가 작성한 코드 인데 영상 속 코드 처럼 안하고 제가 작성한 대로 해도 괜찮은가요?target = train.pop('price') from sklearn.model_selection import train_test_split X_tr,X_val,y_tr,y_val = train_test_split(train,target,test_size=0.2, random_state=0)
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
name, host_name,last review,host_id 삭제
컬럼을 삭제할 때 그냥 아무거나 삭제해도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이제 sklearn에서 rmse를 지원하는걸로 아는데
지원하더라도 그냥 rmse말고 mse를 이용해서 구해도 전혀 상관없는건가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
함수 매개변수 질문
안녕하세요 질문 있습니다!함수 정의시 예를들어 def maxmin(data): 라고 정의를 할 떄,소괄호안 data 에는 아무 값이나 들어가도 되는건가요? maxmin() 일때는 함수 실행이 안되고maxmin(x) 또는 maxmin(y) 등을 쓰면 실행은 되던데... 소괄호 안에 들어 갈 수 있는 변수의 범위가 궁금합니다.