묻고 답해요
156만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2유형 검증데이터분리
작업형 2유형중 검증데이터를 분할할때 기출7을 보면 전체 데이터사이즈는 1000개이고 train = 700 , test = 300입니다 여기서 train_test_split의 test_size를 0.2로한다면 실제 모델이 학습하는 데이터는 560개로 학습하기에는 너무작다고 느껴지고 편향이 있을수 있는데이렇게 문제에서 제시하는 데이터사이즈가 작더라도 train_test_split을 사용해도 될까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 연장(6/18->6/21) 문의드립니다.
선생님 안녕하세요.먼저 좋은 강의 제공해 주셔서 너무 감사드립니다.이번 주 6/21 시험인데, 마침 강의 마감이 오늘 6/18 까지라서 혹시 시험일까지만 강의 연장해 주실 수 있을지 여쭙고자 문의드리게 되었습니다.시험 전 다른 문의들로 바쁘실 텐데 번거롭게 해 드리게 되어 너무 죄송합니다. 문의드릴 때 메일 주소가 필요한 것 같아서 함께 전달드립니다. (ellina0413@gmail.com)확인 부탁드립니다. 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
7회 기출유형(작업형3) 2-2 문제 질문드립니다
전 아래 코드처럼 작성했는데 정답과 다르게 나오더라구요 어느 부분 때문에 다른 건지 알려주실 수 있을까요?df['CPU'] = df['CPU'] < 100 from statsmodels.formula.api import ols model = ols('ERP ~ Feature1 + Feature2 + Feature3 + CPU',data = df).fit() print(model.summary())
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
rmse 문의
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요rmse를 사이킥런에서 지원하지 않아서, mse로 만들어줘야하는 걸로 알고있는데, 그냥 아래처럼 써도 값은 출력되더라고요. 혹시 이유 알수있을까요? from sklearn.ensemble import RandomForestRegressor rf = RandomForestRegressor(random_state=0) rf.fit(X_tr,y_tr) pred=rf.predict(X_val) root_mean_squared_error(y_val,pred)이렇게 쓰면안되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅분기 실기체험환경 Warning
2025 예시문제 작업형 2번 풀었습니다.다른건 괜찮은데xgboost 코드 실행시 warning이 뜨네요.아마 version 관련이라 실제 시험환경에서 크게 점수에 좌우되는 부분 아닌 것 같은데 아시는 분 확인 부탁드립니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
1유형과 3유형도 제출 후 수정이 가능한가요?
다시 수정이 가능할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경 질문이 있습니다..
문제를 풀고 나서 답안지 화면으로 가서 답을 작성할 때 메모장(시험환경)에 작성해둔 것을 보면서 답을 적을 수 있나요? 아니면 문제에 대한 답을 다 외우고 답안지 적는 화면가서 작성해야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 합치기 쪼개기
음, 데이터 전처리 과정에서인코딩할 때,1) 그냥 인코딩 하는 경우2) 데이터를 concat으로 합쳐서 인코딩 하는 경우3) 데이터를 합쳤다가 iloc로 쪼개서 인코딩 하는 경우어떨 때, 위의 경우들이 구분되는지... 예시를 들어주실 수 있나요?ㅠ 자꾸 헷갈리네요..ㅠㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5회 3번, max() 써서 구하는 법 문의
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요아래처럼 여러가지로 해봤는데, 활성화된 코드같은 경우 왜 228을 출력하는지 잘 모르겠어요..ascending=False 안 쓰고, max() 써서 진행하는 방법 설명 부탁드립니다.df['순전입학생'] = df['전입학생수(계)'] - df['전출학생수(계)'] #df.head(3) #가장 많은 학교의 전체학생수를 cond1 = df['순전입학생'].max() #df.sort_values('순전입학생', ascending=False).head(3) #cond1 = df['순전입학생'] == 923 #정수로 출력하시오 print(df['전체학생수(계)'][cond1].sum()) #print(int(df.loc[cond1,'전체학생수(계)'])) #정수로 출력하시오
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
로지스틱 회귀 문제 종속 변수 표현
안녕하세요. 너무 좋은 강의 항상 잘 보고 있습니다. 궁금한 점은..로지스틱 회귀 문제의 경우 결과가 분류로 나오는 것으로 알고 있습니다.model = logit('gender ~ weight', data = train).fit()weight를 독립변수로 하고 gende를 독립변수로 하는 로지스틱 회귀 모델을 만들고,test 데이터의 gender를 예측하는 문제입니다. pred = model.predict(test) > 0.5>0.5 로 명시하지 않으면 1일 확률값이 나오기 때문에 true/false로 나타내도록 하라고 하셨습니다. 궁금한 점은 logit 함수를 만들 때 gender를 범주형으로 명시하지 않아도 되는지입니다.C()로 gender를 묶어보니 에러가 나오더라구요. ㅎ 아직 모르는 게 많아 질문드리니 알려주시면 정말 감사하겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3번문제 정답을 알면 출력 굳이 필요한지 여부 문의
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요df.sort_values('순전입학생', ascending=False).head(1)로 봤을때, 전체 학생수를 바로 알 수 있으니까굳이 출력 코드 안짜고 바로 230으로 제출해도 되나요? 아니면 출력 코드도 짜야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2번문제 len 안 쓰고 풀이 맞는지 문의드립니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요2번문제를 len 안쓰고 이렇게 풀어도 되는가요?결과값은 동일하게 144로 나오는데,sum쓰면서 갯수의 합인지? 각 값의 합인지? 헷갈렸습니다. 갯수의 합이 맞다면 각 값의 합도 구할수있나요?bmi = df['Weight']/((df['Height']*0.01)**2) normal = ((18.5 <= bmi) & (bmi <23)).sum() danger = ((23 <= bmi) & (bmi<25)).sum() result = int(abs(normal - danger)) print(result)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1 -3 iloc 관련 질문
df['총범죄'] 구할 때 iloc[:, 1:-1] 이라고 풀이하셨는데 날짜 강력범죄 절도범죄 폭력범죄 지능범죄 풍속범죄 교통범죄 경찰서 마지막에서 바로 앞부분까지만 출력하려고 -1을 한 건 이해가 갔습니다근데 기출 5회 작업형 1 -3 문제를 보면 전체학생수를 구하는 문제에서 전체학생수의 위치도 마지막 바로 앞인데 iloc[0,-2] 여기서는 왜 -2 인지 궁금합니다. 마지막 앞부분인 것은 동일한데 왜 하나는 -1 이고 하나는 -2 인지 혼동이 오네욥
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
학습 계획
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 강사님,https://inf.run/w8sEV위 링크에서 안내해주신 가이드에 작업형1에 대한 언급은 없으셔서 그런데, 작업형1은 했다는 가정하에 말씀 주신걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
해당 작업형 2유형 문제 OLS로 예측모델 만들기?!
안녕하세요, 선생님.시험이 얼마 안남았지만, 덕분에 잘 준비하고 있습니다!! 다름이 아니라, 문득 어쨋든 회귀분석 문제라면 OLS도 가능하지 않을까 싶어서 한번 시도해봤습니다.레이블 인코딩 진행 후, OLS 회귀모델로 예측모델 만들어서 RMSE 체크해보니, 선생님 선형회귀 에러값 보다 약간 낮게 나오더라고요. 그래서 여쭙는 것은,어쨋든 회귀분석 모델이니 OLS도 작업형 2유형에서 예측모형으로 사용해도 괜찮을지요?그렇다면, 종속변수가 범주형일 때 logistic 회귀분석도 사용해서 예측모형을 만들어도 될지 여쭙니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
train.select_dtypes(exclude='O').columns
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요['ID', 'Age', 'Work_Experience', 'Family_Size', 'Segmentation'] #num_cols = ['Age', 'Work_Experience', 'Family_Size']위에 처럼 안하고num_cols=train.select_dtypes(exclude='O').columns이거 쓰고 싶은데, ID행만 삭제해서 쓰면되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출9회 작업형 3유형 2-2 질문드립니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 2-2번을 동일한 코드를 넣어도 저는 답이 0.692가 나오는데 데이터가 제가 틀리게 작성한부분이 있을까요?2-1번까지는 답이 동일하게 나왔습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
csv 저장 오류
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요마지막에 csv 파일 저장할때 오류 문의pd.DataFrame({'index':test.index, 'y_pred':pred}).to_csv('000000000.csv', index=False)--> 664raise ValueError("Per-column arrays must each be 1-dimensional")
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 답안제출
작업형 2를 만들떄 변수.to_csv("수험번호.csv", index=False)이렇게 만들고 pd.read_csv("수험번호.csv")이렇게 해서 확인할떄이부분도 같이 제출 해도되나요? 아니면 print문이나 이런불필요한 코드는 다 주석처리하거나 지워야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫 인코딩 후 검증데이터 분리
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요수치형이랑 범주형 따로 안나누고 한번에 원핫인코딩을 train_oh, test_oh로 한 다음에는display(train.head()) train_oh=pd.get_dummies(train) test_oh=pd.get_dummies(test) train_oh.head()검증데이터 분리할때 train_oh,y_train 으로 하는게 맞나요?from sklearn.model_selection import train_test_split X_tr,X_val,y_tr,y_val=train_test_split(train_oh,y_train,test_size=0.2,random_state=0)참고로 인코딩전 에, y_train 분리했습니다.y_train = train.pop("TravelInsurance")