묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 질문
안녕하세요작업형 2 모의문제1 강의에서 CLENTNUMBER를 삭제하는게 좋다고 하셨는데, 그럼 이와 유사하게 ID도 항상 삭제하면 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2회 기출유형(작업형2) 원핫인코딩 기준 코드 알려주실수있을까요
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요레이블인코딩말고 원핫인코딩으로만 통일해서 하려고 하는데 코드좀 알 수 있을까요 df = pd.concat([X_train, X_test]) df = pd.get_dummies(df) X_train = df.iloc[:len(X_train)] X_test = df.iloc[len(X_train):] print((X_train.shape, X_test.shape)) 이렇게 하면 될까요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
7회 1유형 1번 질문입니다
선생님 가장 많이 수강한 과목을id = df['id_assessment'].value_counts() 까지만 해서 찾아서 (id=12)답을 적어도 된다하여 거기까지만 작성하고 문제를 풀면 최종답은 (1.732)나옵니다.필터링한 코드가 다 들어가야 2.183이 나오구요~다 작성해야하는건가요 ~(1.732 나온 코드입니다)import pandas as pddf = pd.read_csv("student_assessment.csv")print(df.head())#print(df.shape)df= df.dropna()#print(df.shape)id = df["id_assessment"].value_counts()#print(id)from sklearn.preprocessing import StandardScalerscaler = StandardScaler()df["score"]= scaler.fit_transform(df[["score"]])print(round(df["score"].max(),3))
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[작업형1] 연습문제 12번 문제
안녕하세요.[작업형1] 섹션12번 문제에서 두번째 지시문에 결측치가 있는 데이터(행)을 삭제하라고 되어있는데 답안 내의 주석에는 컬럼 자체를 삭제하도록 해설이 되어있습니다. 답에는 차이가 없으나 저의 문제 이해력이 부족한건지 궁금하여 문의드립니다. 문제)해설)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6회 기출유형 작업형1 마지막문제
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 마지막 범죄 건수 계산문제 질문드립니다.수업 자료에 있는 코드와 아래 작성된 코드에서 어떤 차이가 있어서 결과가 다르게 나오는 것인지 문의드립니다. df['연도'] = df['날짜'].str[:4] df['월'] = df['날짜'].str[6:8] df['총합'] = df['강력범죄'] + df['절도범죄'] +df['폭력범죄'] +df['지능범죄'] +df['풍속범죄'] +df['교통범죄'] #월평균값이 가장 큰 연도 찾기 result = df.groupby(['연도','월'])['총합'].sum() result.head() #연도별로 총 범죄 건수(범죄유형의 총합)의 월평균 값을 구한 후 그 값이 가장 큰 연도를 찾아, 해당 연도의 총 범죄 건수의 월평균 값을 출력하시오. result2 = result.groupby('연도').mean() result2 = result2.sort_values(ascending = False) result2 #23년도 print(df.groupby('연도')['총합'].mean())
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 전처리 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요train = train.drop('id', axis=1) test_id = test.pop('id') 왜 트레인은 axis를 넣는데 테스트아이디는 저걸 넣지 않을껄까요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가모델을 하나로 통일하면안될까요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 작업형2에서 평가점수를 높이기 위해 선형회기 랜덤포레스트 xgb등을 써보면서 높은 점수를 선택하셨던데, 제가 완전 초보여서 시험장에서 그럴여유가 있을지 모르겠습니ㅏㄷ... 그래서 그냥 랜덤포레스트 하나만 달달 외워서 만능으로 쓰면 안될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4. 일원 분산 분석 에서 귀무가설을 채택하는 이유가 무엇일까요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요p_value가 0.05보다 적으니 귀무가설을 기각하고 대립가설을 채택한다고 생각했는데 귀무가설을 채택한다고 해서 제가 잘못 이해한건지 궁금합니다 stats.f_oneway(df[cond1]['scores'], df[cond2]['scores'], df[cond3]['scores'], df[cond4]['scores']) from statsmodels.formula.api import ols from statsmodels.stats.anova import anova_lm model = ols('scores ~ groups', data = df).fit() print(anova_lm(model))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 연습문제 22번 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요Section 22. 시간 간의 차이 계산(분), 그룹핑앱 종류별로 평균 도착 시간(분)을 계산하시오. -> 아래는 코랩에 올라온 코드인데요 # 실제 도착시간과 주문시간 차이 계산(분) df['diff'] = (df['실제도착시간'] - df['주문시간']).dt.total_seconds()/60 # 앱종류별 도착시간과 주문시간 차이의 평균 계산 df = df.groupby('앱종류')['diff'].mean()앱종류별 평균도착시간을 구하려면 아래처럼 쓰이는게 맞지 않나 싶어 문의드립니다. df= df.groupby('앱종류')['실제도착시간'].mean()
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출9회 작업형 1 1번 3번
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요1번에서는 두 조건이 맞는 그룹화를 다음과 같이 코딩하셨는데요 왜 3번에는 transform함수가 붙나요?? 두 경우 모두 두가지로 그룹화한다는 점에서 같아 보이는것 같아서 이해가 잘 안됩니다..! #1번 df=df.groupby(['지역코드','성별'])['총대출액'].sum().unstack() #3번 gm=df.groupby(['부서', '성과등급'])['근속연수'].transform("mean")
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경 오류
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요시험환경 들어가면 페이지를 찾을 수 없다고 나오는데, 어떻게 해야 되나요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 한가지 방법으로 풀기 질문
강사님께서 "작업형2 한가지 방법으로 풀기"에서 학습을 RandomForest로 진행하셨는데, "lightGBM 잘 활용하기"에서는 lightGBM 사용 시 인코딩이 필요가 없다고 하셔서, 오히려 한가지 방법으로 간단하게 풀려면 lightGBM이 더 적합해보이는데, lightGBM 하나로 쭉 밀고 나가도 문제가 없을까요?그리고 분류 모델은 LGBMClassifier(random_state=0)인 걸로 영상에서 확인했는데, 회귀 모델은 나와있지 않아서요..! LGBMRegressor(random_state=0)으로 사용하면 될까요?감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기 체험 환경 질문드립니다.
체험 환경에서는 csv 파일을 직접 탭으로 열어서 볼 수 있게 되어 있던데, 실제 시험 환경에서도 동일한가요?작업형 모의문제에선 df.head()로 csv 파일을 대략적으로 살펴보았는데, 만약 시험 환경에서도 csv 파일을 열어볼 수 있다면 이 과정이 필요하지 않을 것 같아 질문드립니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8 회귀 연습문제 6,10번 문제
광고비가 각각 500,000, 300,000이 아니라 500, 300 아닌가요~?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
rmse
선생님 rmse 지금 코랩에서는 sklearn에서 제공하있는데시험장에서는 함수만들어야되나요? 시험장기준으로말씀부탁드립니다!
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모델학습시에
분류는 랜덤포레스트클래서파이어 회귀는 랜덤포레스트리그레서로 통일해서 진행해도될까요?다른 모델도 굳이해야되나 현실성있께 말씀해주시면좋겠어요빠르게합격하고싶어요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
rmse sklearn제공
아직도제공안해주나요? 아니면 업데이트되서 제공해주나요 되는것처럼보여서요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
머신러닝 모델
하나는 선형회귀 모델로 예측한것이고 하나는 랜덤포레스트 모델로 예측한 결과값인데 생각보다 차이가 커서 당황스러운데 원래 이정도 차이나는게 맞을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
랜덤스테이트 숫자
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요어떤 강의에서는 0으로 쓰시고 해당 강의에서는 2022로 쓰시는데 어떤 숫자든 아무거나 통일되게만 쓰면 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
loc사용법 문의드립니다.
기출6회 작업형 1-1번 풀이중 loc를 아래와 같이 사용했더니 상위 5개만 출력이되는데요사용법이 어떤점이 잘못된건지 왜 저렇게 출력이되는지 궁금합니다 둘의 차이점도 왜 저렇게 되는지 궁금합니다df.loc[:10, 'views'] = min_valuedf.iloc[:10, -1] = min_value#주어진 데이터셋(members.csv)의 'views'컬럼 상위 10개 데이터를 'views' 컬럼 상위 10번째 값으로 대체한 후 #'age'컬럼이 80 이상인 데이터의 'views' 컬럼 평균값을 구하시오.(반올림하여 소수 둘째 자리까지 계산) import pandas as pd df = pd.read_csv('members.csv') # print(df.head()) df.info() df = df.sort_values('views', ascending=False) print(df.head(15)) min_value = df['views'].sort_values(ascending=False).iloc[9] print(min_value) df.loc[:10, 'views']