묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
점수의 기준은 어떻게 되는건가요?
여기서 나온대로 코드를 짜진 않았고 제 마음대로 했는데요.macro f1-score으로 평가한다고 해서 평가모델을 만들어서 넣어봤는데, 0.52가 나왔습니다..이 0.52 라는 숫자가 작은 것 같은데 하이퍼파라미터튜닝을 해도 고만고만 하더라고요.근데 3회차에서 roc_auc_score로 검증해봤을땐0.7 정도가 나왔던거 같아요..제가 검증하는 숫자가 낮은지 높은지 기준은 없는건가요? 그리고 최종 파일을 컴피티션에 올리면 점수가 나온다고 했는데, 거기서는 0.31이 나왔는데요..선생님은 0.3 쯤이 나왔는데 별 신경을 안쓰시길래.. 무슨 차이인지 몇점이 나오든 그거는 상관 없나요? @.@;;
-
해결됨실무에서 사용하는 클라우드 보안 프로그래밍 (AWS, Python, Terraform)
boto3 라이브러리 사용 시 에러
안녕하세요 boto3 라이브러리를 처음 사용하는 강의에서 import한 라이브러리(boto3)와 실행하는 파이썬 파일(boto3.py)의 이름이 동일한데 어떻게 실행이 되는건가요 ?? 일반적으로 파이썬 사용할 때 라이브러리명과 파일명이 동일하면 AttributeError 에러가 발생하던데 강의에선 별 다른 제약 없이 실행이 되는거 같아 질문드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 T2-1 코드 봐주실 수 있나요??
아래 코드에서 잘못된 부분은 없는지, 어느 부분을 보완하면 좋을지 알고 싶습니다 문제 : 학습용 데이터 (X_train, y_train)을 이용하여 생존 예측 모형을 만든 후, 이를 평가용 데이터(X_test)에 적용하여 얻은 예측값을 다음과 같은 형식의 CSV파일로 생성하시오(제출한 모델의 성능은 accuracy 평가지표에 따라 채점) 코드 : # 라이브러리 불러오기 import pandas as pd train = pd.read_csv("train.csv") test = pd.read_csv("test.csv") # EDA train.shape, test.shape # ((891, 12), (418, 11)) train.isnull().sum() test.isnull().sum() # 전처리(결측치, 인코딩, 스케일링, 타겟) train = train.dropna() test = test.dropna() train.shape, test.shape # ((183, 12), (87, 11)) train.describe() train = pd.get_dummies(train) test = pd.get_dummies(test) target = train.pop("Survived") # 모델링 from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size = 0.2, random_state = 2024) from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state = 2024) rf.fit(X_tr, y_tr) pred = rf.predict(X_val) # 평가 from sklearn.metrics import accuracy_score accuracy = accuracy_score(y_val, pred) # 제출 result = pd.DataFrame({ "PassengerId" : X_val["PassengerId"] , "Survived" : pred }) result.to_csv("수험번호.csv", index = False)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
마지막에 csv 제출이 안됩니다.
마지막에 저장이 안되는데 제가 뭘 또 잘못한 걸까용..!평가까지는 잘 했는데, 마지막에 요러니 당황스럽군요..!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실제 시험 환경에서...
선생님, 실제 시험 환경에서 아래처럼 색 알록달록하게 보여주나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코드 작성할때 ...
선생님!, 기출보고 있는데 코드 수정시 타이핑 하는 글들이 삽입이 아니라 수정으로 되는데 ... 이거는 세팅을 바꿀 수 없나요?쉽게 설명하자면 아래한글 보면, 아래쪽에 수정/삽입 바꿀 수 있는 것 처럼요. 에러나서 코드 다시보면서 작성하는데 타이핑 하는것들이 삽입되는게 아니라 뒤에 글들을 지우면서 쳐집니다 ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
타이타닉 loc
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요train_data.loc[train_data.Sex=='male']['Survived']로 필사가 되어있는데여기서 굳이 loc를 써야하는 이유를 못찾아서요!train_data[train_data.Sex=='male']['Survived']이렇게 적는다면 이해가 되는데 .....또한 loc 공부할 때특정 행을 추출하는거면 df.loc[행 인덱스명]특정 열을 추출하는 거면 df.loc[:, 열 인덱스명]특정 행과 특정 열을 추출하는거면 df.loc[해당 행의 인덱스명, 해당 열의 인덱스명] 이렇게 메모하고 암기했습니다그러나 train_data.loc[train_data.Sex=='male']이게 앞에 :,가 생략되어도 상관없는건가요? 이렇게 생긴건 행 추출인데 행인덱스명을 안써서요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문의입니다.
안녕하세요. 저번에 해주신 조언대로 일단 외우기보다 강의진도를 먼저 빼고 있는데, 점점 양이 많아지다보니 걱정됩니다ㅠ 전에 디스코드 들어오셨냐고 물어보시던데, 디스코드에 들어가면 어떤게 좋은건지요? 과제나 학습이 이루어지는건가요? 강의진도 기출문제만 남겨놓고 거의 끝나가서 공부를 어떻게 해야할지 모르겠어서 문의글 남깁니다
-
미해결실습으로 끝장내는 웹 크롤링과 웹 페이지 자동화 & 실전 활용
셀레니움 By.XPATH 를 이용한 키워드 입력 작성 질문입니다.
By.XPATH를 이용한 태그 선택과 키워드 입력 방법 강의를 들었는데요. 강의에서 말씀하신대로 코드를 작성하였는데 키워드가 검색창에 입력이 되지 않습니다. 개발자도구에서 확인한 네이버 검색란 태그를 다음과 같이 확인하였습니다. 제가 입력한 코드는 아래와 같습니다. from selenium import webdriver from selenium.webdriver.chrome.options import Options from selenium.webdriver.chrome.service import Service from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys from webdriver_manager.chrome import ChromeDriverManager import time options = Options() options.add_argument("--start-maximized") options.add_experimental_option("detach", True) service = Service(ChromeDriverManager().install()) driver = webdriver.Chrome(service=service, options=options) url= "https://naver.com" # 요소 선택하는 법 # # driver.find_element(By.CLASS_NAME) # driver.find_element(By.ID) # driver.find_element(By.CSS_SELECTOR) # driver.find_element(By.NAME) # driver.find_element(By.TAG_NAME) # driver.find_element(By.XPATH) # driver.find_element(By.LINK_TEXT) # driver.find_element(By.PARTIAL_LINK_TEXT) driver.get(url) time.sleep(2) """ <input id="query" name="query" type="search" title="검색어를 입력해 주세요." placeholder="검색어를 입력해 주세요." maxlength="255" autocomplete="off" class="search_input" data-atcmp-element=""> """ driver.find_element(By.XPATH, '//input[@title="검색어를 입력해주세요."]').send_keys("박효신")
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 T1-9. Standardization
문제를 2가지 방식으로 풀어보았습니다.1) StandardScaler사용from sklearn.preprocessing import StandardScalersc = StandardScaler()df['f5'] = sc.fit_transform(df[['f5']])print (df['f5'].median()) 2) 평균과 표준편차를 구하여 직접 식에 대입m = df['f5'].mean()s = df['f5'].std()df['f5'] = (df['f5']-m) / sprint (df['f5'].median()) 답이 1)에서는 0.2606196295590152)에서는 0.2593132572746011 2)에서 답이 다른데, 뭐가 문제일까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수치형 베이스라인에서 model.fit(X_tr[cols],y_tr) 질문사항
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요예시문제 작업형2(신버전)강의 내용 17분 16초 쯤에 수치형 베이스라인으로 작업을 하실 때 아래와 같이 코딩을 하셨는데 model.fit(X_tr[cols],y_tr)pred=model.predict_proba(X_val[cols]) 이미 train_test_split 을 할때 train[cols] 을 활용해 데이터 분할을 하였기에 굳이 다시 쓰기보단 model.fit(X_tr,y_tr)pred=model.predict_proba(X_val) 이런식으로 작업을 해도 괜찮은지 여쭤보고 싶습니다. 실제로 이렇게 작업을 했을 때도 문제가 없었는데 혹시나 한번 여쭤보고 싶어 이렇게 글을 올립니다. 감사합니다:)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형에서 제출 이후에도 재제출이 가능한가요?
답안을 일단 먼저 제출하고나서, 이후에 파라미터를 수정하고 다시 파일을 제출해되 되는지 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
정답제출
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 b.sort_values(ascending = False).index[0] 위와 같이 index[0]로 추출하여 제출하지말고 눈으로 정렬된 결과를 보고 print('smoothness error')로 제출해도 괜찮나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결측값 처리 관련 궁금합니다
결측값을 찾아 다른값으로 대체하는 등의 문제를 풀때 df[‘f3’].fillna(0)또는 넘파이 이용해서 df[‘f3’].replace(np.nan,0) 두개는 완전히 같은 기능인가요? 3번은 후자로 풀이해주셨는데 fillna 가능한지 궁금합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
train test 합쳐서 인코딩후 나누기
train, test 데이터의 범주형 카테고리가 다르다고 가정하고무조건 데이터를 합쳐서 인코딩후 다시 train, test 로 나누는 절차로시험 준비를 해볼까 생각이 드는데요선생님 의견이 궁금합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
동영상 강의와 똑같은 수식을 적은것 같은데 오류가 납니다.
데이터 핸들링을 위한 판다스 기초 1 동영상 강의에서 df.corr이나 car.nunique 수식을 작성할 때 에러 메세지가 뜹니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
동영상을 보면서 실습은 못하는건가요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀 rmse
회귀실습 따라하던 중 이런 오류가 떴는데 어떻게 해결해야할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
에러메세지와 마주하기 에러 4번
9분 09초영상과 노트북의 코드가 다른데요# 풀이 코드 # X_train, y_train, X_test 3개 파일이 주어졌을 때 from sklearn.datasets import load_wine wine = load_wine() df = pd.DataFrame(wine.data, columns=wine.feature_names) df['target'] = wine.target from sklearn.model_selection import train_test_split X_train, X_test, y_train, _ = train_test_split(df.drop('target',axis=1), df['target'], test_size=0.2, random_state=2022) # 만약 'proline'컬럼의 값이 1500 일때 이상치라고 판단해 삭제 했다면? print("1500이상인 데이터 수:", sum(X_train['proline'] >= 1500)) # 삭제할 데이터의 인덱스 값을 구하고 drop함수를 통해 삭제 ind = X_train[X_train['proline'] >= 1500].index print("삭제할 index:", ind) X_train = X_train.drop(ind) # 기본값 axis = 0 y_train = y_train.drop(ind) from sklearn.ensemble import RandomForestClassifier model = RandomForestClassifier() model.fit(X_train, y_train)(질문1 )X_train에 y_train를 합친뒤 이상치를 삭제하는 것보다 각각 개별로 삭제하는게 더 간단해서 수정한건가요?(질문2) df 에서 이상치를 제거한 후에 train_test_split 으로 데이터를 나눠도 되는건가요?
-
해결됨파이썬 중급
eval(repr(p)) 가 진짜 Pair 객체로 만들어지는 이유?
안녕하세요 강사님, 수업 잘 듣고 있습니다. 좋은 강의 만들어 주셔서 감사드립니다.수업을 듣다가 9분 12초 쯤에서 질문이 있어서 게시글 남깁니다.eval(repr(p)) 에서,repr(p) 가 Pair 라는 클래스를 호출해서 인스턴스로 만드는 string을 나타내기 때문에, eval()을 했을 때 Pair라는 객체가 생성되는 게 맞을까요?바꿔서 말하면 repr(p)가 평가되었을 때 Pair(3,4)와 같은 객체 생성 expression과 같기 때문에 그 expression이 eval()을 타서 Pair 객체가 만들어지는거죠?! 답변 주시면 감사하겠습니다!