묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
46강 다중선형회귀2(범주형변수) 질문합니다.
두 가지 질문이 있습니다.1. 아래 코딩부분 강의에서는 유형별로 0,1 로 나오는데 제꺼는 true, false 로 나옵니다. 문제 없는건가요? 왜 다르게 나오는지 알고싶습니다.#원핫인코딩df2 = pd.get_dummies(df)df2.head() model.summary 했을 때 나오지 않은 유형(강의에서는A)를 drop하면 되는건가요? 전부 다 나온다고 하면... 어떤 기준으로 드롭해야할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출2회 작업형1 문제2
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요!기출2회 작업형1 2번문제 문의드립니다.std1과 std2가 같게 나왔는데,한번에 돌리다보니 덮어써진 것 같습니다.질문들을 찾아보니 코드를 다시 쓰면 된다고 답변을 다셨던데, 어디에 어떤 코드를 쓰면 될까요?그리고 처음 std1을 찾을 때도 강의와는 다른 값이 나오던데, 이거는 이유가 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2번문제
import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/5_1/5-2bmi.csv") # your code df['bmi']=df['Weight']/(df['Height']*df['Height'])*10000 df['위험']=(df['bmi'] >=23) & (df['bmi']<25) df['정상']=(df['bmi'] >=18.5) & (df['bmi']<23) print(sum(df['위험']),sum(df['정상'])) 저는 코드를 이렇게 짰는데,, 위험이 2129명이라고 나오는데 선생님이 올려주신 정답지는 2130명이더라구요 ㅠ왜다를까요? 2. bmi를 계산하고, 수치가 정상인 사람 수와 위험체중인 사람 수의 차이를 절대값으로 구하시오 (정수로 출력) - bmi(체질량지수): 몸무게(kg) / 키(m)의 제곱 단위 - Height: cm - Weight: kg - 저체중: BMI 18.5미만 - 정상체중: BMI 18.5이상 ~ 23미만 - 과체중 또는 위험체중: BMI 23 이상 ~ 25미만 - 비만체중: 25이상
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
주석관련
강사님 덕에 아무것도 몰랐던 파이선에 대해서 알고 빅분기 실기 준비 원활하게 잘 하고 있습니다.주석처리 관련해서 Ctrl+/로 하는 걸로 아는데요.. 코랩이나 실기체험 프로그램에서 처음엔 잘 되다가 몇 분 지나면 안되는데, 왜 그럴까요.. 안되니까 너무 답답하네요...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 작업형2 코딩방법
저는 문제를 보고 9회차의 작업형2 방식과 동일하게 아래와 같이 했는데요이렇게 해도 되나요?drop와 레이블인코딩을 하지 않았을때값이 10정도 차이가 나서 질문 드립니다! # 라이브러리 및 데이터 불러오기import pandas as pdtrain = pd.read_csv("churn_train.csv")test = pd.read_csv("churn_test.csv") target = train.pop('TotalCharges') train = pd.get_dummies(train)test = pd.get_dummies(test) from sklearn.model_selection import train_test_splitX_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0) #랜덤포레스트from sklearn.ensemble import RandomForestRegressorrf = RandomForestRegressor(random_state=0)rf.fit(X_tr, y_tr)pred = rf.predict(X_val) from sklearn.metrics import mean_absolute_errorprint(mean_absolute_error(y_val, pred)) # LightGBMimport lightgbm as lgblg = lgb.LGBMRegressor(random_state=0, verbose=-1)lg.fit(X_tr, y_tr)pred = lg.predict(X_val)print(mean_absolute_error(y_val, pred))
-
미해결[4주완성] 11회 빅분기 오징어 게임 (빅데이터 분석기사 실기)
대화방이 어디에 있는건지요?
미션에 TIL 대화방에 간단히 작성이 있는데.. 작성할 대화방을 못찾고있어요.ㅠ 혹시 디스코드 말씀이신지..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
20강 평균내용
평균이 왜 다를까용?...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제1-1 .copy()
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 여기서는 데이터셋 분할시에는 .copy()는 안해도 괜찮나요? 작업형 3에서는 데이터 분할시에는 .copy() 적어주는게 좋을지요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
7회기출 작업형 1_1번문제
import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/7_1/student_assessment.csv") print(df.head()) print(df.shape) print(df.isnull().sum()) df = df.dropna() print(df.isnull().sum()) print(df.shape) print(df['id_assessment'].value_counts()) cond = df['id_assessment'] == 12 df = df[cond] print(df.head()) df['zscale'] = (df['score'] - df['score'].mean()) / df['score'].std() print(df.head()) print(df['zscale'].max()) #ANS=2.150 저는 z스케일을 식으로 (표준편차/(값-평균))으로 구했는데 퇴근후딴짓님이 skkearn.preprocessing 으로 불러와서 구한것과 살짝 차이가나네요 왜 틀린건지 알수있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모의2 문제6 질문
모의2 문제6에서 0이하인 데이터를 ~로 지우셨는데요!혹시 drop() 으로 지울 수 있는 방법이 있나요? 감사합니다import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/main/p1/members.csv") r1 = df['views'].std() cond = df['age'] <= 0 # print(df.shape) df = df[~cond] # print(df.shape)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강기간 !
안녕하세요 선생님!시험 전까지 이해안가는 부분은 강의를 다시 들어보면서 복습을 진행하고 싶습니다.하지만 수강 만료일이 11월6일이라 앞으로 어떻게 공부를 해야할지 모르겠습니다 ㅠㅠ..혹시 시험일까지만이라도 수강 기간을 연장할 수 있는 방법은 없는지 문의 드립니다-!이메일은 maldong97@naver.com 입니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
9회 기출 작업형3 문제1-3
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요선생님, 쌩초보입니다..너무 기초적인 질문일 수 있는데요,,문제 1-3 에서는data = test 라는 과정은 필요 없나요?1-2 적합한 회귀모형을 사용하랬으니,predict하는 과정만 있으면 된다고 이해하면 될까요from statsmodels.formula.api import ols model = ols("design ~ c1 + c2 + c4 ", data=test).fit() print(model.summary())
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
랜덤포레스트로만 밀어도 문제없나요?
여러가지를 써보고 가장 좋은걸 선택하는게 베스트겠지만.. 다 외우기 어렵다고하면 랜덤포레스트 하나로만 우직하게 밀고가도 합격에 문제없을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
어떤식으로 공부를 해야 좋을까요?
1강부터 쭉 강의를 들으면서 노트북 보고있는데 어렵긴한데.. 일단 한번 쭉 들어보고 차근차근 정리를 해야할까요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
자료 다운로드해서 어디에 올려야하나요..?
잘몰라서.. 계속 노트북 링크로만 하고있습니다.방법이 어떻게 될까요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
머신러닝 인코딩(labelencoder)관련 질문
작업형 2 머신러닝 모의2번 문제에서 labelencoder할때, 명령어가 le = LabelEncoder()로 지정하고 아래와 같이 transform할때 fit을 넣고 다음에는 안넣는데, 추측하기로는 train 데이터에서 object 유니크 수를 파악하고 이에 맞는 것으로 변형하기 때문에 fit을 쓴것 같습니다. 그렇다면 trian이랑 test랑 유니크 수가 다르다고 하면 아래와 같이 쓰면 안되지 않나요? 아니면 알아서 잘 수치화가 진행되는걸까요? 일전에 강의에서는 train과 test에서 유니크 수가 다르면, 두 데이터를 상하로 합쳐서 같이 적용하고 나눈다고 들었어서 여쭤봅니다.train[col] = le.fit_transform(train[col]) test[col] = le.transform(test[col])
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2번, 수치형 변수 스케일링 굳이 해줘야 하나요?
작업형 2유형 문제 궁금한게 있습니다.수치형 변수 스케일링을 하셨는데, 시험에서도 저 코드를 꼭 써야 하나요?저거를 임의로 판단을 해서 하는건가요? (마지막에 성능 지표로 확인해서 임의 판단인지) 아니면 시험장에서도 문제에서 명시가 되어있는걸까요?혹여나, 문제에서 명시 되어 있지 않는데 굳이 저걸 했다가 감점을 받지 않나 해서요저걸로 가점이 된다면, 항상 모든 문제에 수치형 변수 스케일링을 추가 해줘야 하는거 아닌가요?왜 문제 마다 수치형 스케일링을 해주는 경우도 있고 아닌 경우도 있고.... 이해가 안갑니다그리고 RobustScaler를 적용 하셨는데, MinMaxScaler로 해도 되나요? (다른 수치형 스케일링을 써도 되는지 여쭤봅니다)그리고 하이퍼 파라미터도 문제에 명시 안되어있는데, 저것도 임의 판단해서 쓰는건지 궁금하네요.시험 문제에는 저렇게 간략하게 나오는건가요? 문제에서 딱.. 하이퍼파라미터 적용.. 수치형 스케일링 적용... 이렇게 나오는게 아닌걸까요??너무 추상적이에요...만약 저렇게 추상적이게 나온다면, 임의로 성능 지표를 확인해가며, 수치형이 있다면 스케일링을 적용해보고, 하이퍼 파라미터가 성능 지표가 높게 나온다면 적용해보고... 이렇게 해야하는건가요?(외람된 질문이지만, 성능 지표가 너무 높게 나와도 안좋은거 아닌가요? 과적합 문제라던지요..)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제 7번, 풀이 코드 cond = df.iloc[1] > mean_2001 관련
저는 저 부분을 아래와 같이 for문 안에 if구문으로 처리 하고 싶었는데...if구절에서 i 값을 찍어보면 처음 값만 데이터 그대로 나오고.. 그 담부턴 어뚱한 값이 나오네요..뭘 잘못한걸까요? ㅠㅠmean_2001 = df.iloc[1].mean() print(mean_2001) #print(df.iloc[1]) #cond = df.iloc[1] > mean_2001 #sum(cond) for i in list2001: if i > mean_2001: print(i)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2회 기출 1번 문제
1번 문제 코드를 짜보았는데 결과 값이 조금 다른 것 같아서 질문 드립니다import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p1/members.csv") df.nlargest(10, 'views') m=df.loc[21,'views'] df.iloc[:10,-1]=m cond=df['age']>=80 df[cond]['views'].mean()
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형3(ver. 2023-2) / 로지스틱 회귀 내용 포함(필수)
제목과 같이, 로지스틱 회귀 내용에 대한 코드는 없나요? 삭제된것일지 궁금합니다. 필수적으로 들어야하나요?