묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1_문제3
안녕하세요, 저는 알려주신 코드와 동일하게 작성한 것 같은데, 결과 값이 'id'로 나오는데 뭐가 문제일까요 import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p1/members.csv") df = df.isnull().sum() print(df.sort_values(ascending=False)) print(df.index[0]) 11:06초먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결측치 처리 관련 질문입니다.
train과 test의 결측치를 보면 object 컬럼들이 결측치가 많아 단순히 dropna를 시키면 문제가 있을까요?dropna로 test의 행의 사이즈가 달라지면 오답이 되나요?범주형 변수들의 결측치를 처리할때 X로 채우신 이유가 궁금합니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
한가지 방법으로 작업형 2 풀기 질문
안녕하세요 질 좋은 강의 올려주셔서 항상 감사합니다.몇가지 질문을 하고싶은데traget=train.pop('타겟') << 이거를 인코딩 하기 전에 하는것이 나을까요 아니면 검증데이터 분할하기 전에 하는것이 나을까요?학습시간이 촉박해서 그런데 인코딩에서 레이블인코딩을 학습하지 않고 그냥 원핫인코딩 하나만 학습해서 시험을 쳐도 무리 없을까요? 그리고 머신러닝 학습에서도 lightgbm이나 XGBoost나 다른 모델을 쓰지않고 그냥 랜덤포레스트 하나만 학습해서 시험을 쳐도 합격하는데는 큰 무리가 없을지 궁금합니다!감사합니다 추가적으로작업형 2에서 이상치 조정, 스케일링, 하이퍼 파라미터 튜닝 이 세가지 작업도 굳이 하지 않아도 점수에 큰 영향이 없다면 패스하고 싶은데 괜찮을지 여쭤봅니다!!
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
section12 2유형(2025)
문자형 데이터의 칼럼을 라벨, 원핫 인코딩 말고 삭제해도 괜찮을까요 ?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션12 작업형2 (2023년)
section12 작업형2 (2023년) 문제를 풀어보고 싶은데 링크를 누르면 영상 문제와 같은 문제가 아닌데 풀어볼 방법이 없을까요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
독립표본 t검정
독립표본 t 검정 진행 후 결과를 볼 때ttest_ind() 까지만 적은 후 나오는 결과와여기에서 t_statisstic과 p-value를 따로 출력해서 보이는 결과가 다르게 나옵니다,
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코랩설정질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 제가 이전에 코랩을 설치한적이 있는데 설정을 잘못한건지 매 코드 행마다 앞에 숫자 1이 적혀져있는데 잘못된건가요? 아니면 새버전에서는 원래 1이 적히는건가요? 선생님처럼 숫자 1이 안뜨게하려면 어떻게해야할까요 감사합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3회 기출유형 (작업형2)
n_train = train.select_dtypes(exclude='object') c_train = train.select_dtypes(include='object')데이터 분리할때 .copy() 안써도되나? 뭐가 달라지는건가요? 또 마지막에 파일 제출할때test.index가 무엇을 의미하는지 궁금합니다.이코드로 0부터시작하는 인덱스를 자동으로 생성할 수 있는건가요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀연습문제 섹션1번
import pandas as pd train = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p2/flight_train.csv") test = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p2/flight_test.csv") target=train.pop('price') df=pd.concat([train,test],axis=0) df=pd.get_dummies(df) train=df.iloc[:len(train)].copy() test=df.iloc[len(train):].copy() from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split(train,target,test_size=0.2,random_state=0) from sklearn.ensemble import RandomForestRegresor rf=RandomForestRegressor(random_state=0) rf.fit(X_tr,y_tr) pred=rf.predict(X_val) pred=rf.predict(test)카테고리 수가 달라서 concat으로 코딩을 해보았는데 오류가 나는 이유가 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 모의문제1 2번문제
작업형 모의문제1 2번 문제에f3'컬럼의 'gold' 값을 가진 데이터 수를 출력하세요!문제에서 print(sum(df['f3']=='gold') 가 당시 문제를 풀 때 생각이 나지 않아서 df1 = df[df['f3']=='gold'] print(len(df1))이렇게 작성해서 문제를 풀었습니다.똑같은 정답인 56 이 나오는 거면 이상이 없는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
슬라이싱
pred[:,1]이게 슬라이싱 개념으로 이해하면될까요?iloc 과 무슨 차이인지 헷갈립니다. pred.iloc[:,1] 느낌상 이게 더 맞는거 같아서요(대상이 데이터 프레임인지 아닌지의 차이인가요)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
구글 코랩 자동완성 해제
구글 코랩에서 코딩이 자동완성 되는데 불편해서 기능을 해제하려고 설정에 들어가서 찾아봤는데 "코드 완성 제안을 자동으로 표시" 탭이 없습니다..!책이나 기존에 실습한 내용을 복기하며 직접 코드를 작성하고 싶은데 자동완성으로 떠서 불편합니다 ㅠㅠ 기능을 없앨 수 있는 방법이 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2회 기출유형(작업형1) 질문
min_value = df['views'].iloc[9] df['views'].iloc[:10] = min_value이 코드는 왜 안되는지 궁금합니다df.iloc[:10,-1] = min_value 풀이의 이 코드는 데이터 프레임에서 슬라이싱한거고제 코드는 시리즈 형태에서 슬라이싱한거같은데 이렇게는 안되나요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
y_test 데이터의 용도
y_test 데이터의 용도가 궁금합니다. test데이터의 원래 실제 값이 y_test값인거고,시험에서나, 실무에서나 원래는 없는 값이지만내가 만든 모델이 성능이 어떤지 확인해보기 위해서 제공되는 자료라고 이해하면 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모델 평가
안녕하세요 선생님. 머신러닝 학습을 할 때 강의에서 굉장히 다양한 모델을 사용해주시는걸 보고 있습니다. 혹시 모델을 랜덤포레스트 하나로만 사용해서 진행을 해도 되는걸까요? 아니면 저런식으로 다양한 모델을 써서 수치를 확인하고 잘 나온 모델로 해야되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강기간 2주 연장 가능 여부
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요? 강사님. 현재 수강중인 빅데이터분석기사 강의가 11/16까지인데, 이번 시험까지 연장을 요청드릴 수 있는지 문의드리고자 질문드립니다. 혹시 방법이 있으면 공유받고 싶습니다.ㅠ번거롭게 해드려 죄송합니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험 1, 3유형 답안 제출시
마지막 코드까지 꼭 다 적어야 하는지 여쭤봅니다 박스나 프린터해서 답이 보이면 그 상태에서 답안제출해도 되는거죠?? 코드 안적어 놓아도 ~ 되는건지 여쭤봅니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 불러오는 방법
section12 (2021년) 문제는 구글 코랩 링크로 열어서 푸려고 하는데 데이터를 어떻게 불러오나요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2에서 분류모델을 쓰는 이유
보통 분류를 쓸지 회귀를 쓸지 정할때 문제를 보고 평가지표를 통해서 판단을 했는데, 주어진 평가지표가 없기도 하고 타겟이 확률이라 연속형이라 생각해 회귀로 진행했는데 분류모델로 진행하는 문제였네요 평가지표를 안준다면 분류와 회귀중 어떤것을, 그리고 평가지표 하나를 어떻게 선택하는게 맞을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 강의 질문
y_train = train.pop("income") 선생님 따라서 이렇게 했는데 저는 밑처럼 오류가 나오더라구요ㅠ 원인이 무엇일까요 --------------------------------------------------------------------------- KeyError Traceback (most recent call last) /usr/local/lib/python3.12/dist-packages/pandas/core/indexes/base.py in get_loc(self, key) 3804 try: -> 3805 return self._engine.get_loc(casted_key) 3806 except KeyError as err: index.pyx in pandas._libs.index.IndexEngine.get_loc() index.pyx in pandas._libs.index.IndexEngine.get_loc() pandas/_libs/hashtable_class_helper.pxi in pandas._libs.hashtable.PyObjectHashTable.get_item() pandas/_libs/hashtable_class_helper.pxi in pandas._libs.hashtable.PyObjectHashTable.get_item() KeyError: 'income' The above exception was the direct cause of the following exception: KeyError Traceback (most recent call last) 4 frames /usr/local/lib/python3.12/dist-packages/pandas/core/indexes/base.py in get_loc(self, key) 3810 ): 3811 raise InvalidIndexError(key) -> 3812 raise KeyError(key) from err 3813 except TypeError: 3814 # If we have a listlike key, _check_indexing_error will raise KeyError: 'income'