묻고 답해요
164만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결안정적인 수익 내는 코인 자동매매 봇 만들기 - 그리드전략 편
dotenv 로드 실패
안녕하세요.python 3.10 을 설치했고dotenv 설치했습니다.C:\Users\SDS>pip install python-dotenvCollecting python-dotenv Downloading python_dotenv-1.2.1-py3-none-any.whl.metadata (25 kB)Downloading python_dotenv-1.2.1-py3-none-any.whl (21 kB)Installing collected packages: python-dotenvSuccessfully installed python-dotenv-1.2.1 .env 파일에 API키 입력해줬구요그랬는데 app.py 실행하면 dotenv module 로딩이 안되는 것 같습니다.PS D:\autotrading> & C:/Users/SDS/AppData/Local/Programs/Python/Python310/python.exe d:/autotrading/app.pyTraceback (most recent call last): File "d:\autotrading\app.py", line 3, in <module> from dotenv import load_dotenv # 환경변수 관리ModuleNotFoundError: No module named 'dotenv'뭘 빠뜨린걸까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
연습문제 3형도 ~~
바쁘시겠지만 올려주시면 감사하겠습니다 ㅠㅠ
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
f1_score
안녕하세요 항상 강의 잘 보고있습니다 몇가지 궁금한게 생겨서 질문하고싶은데 전에 강의 들을때 f1스코어 에서 pos_label을 붙이셨던걸 봤는데 이걸 붙이고 안붙이고는 어떻게 판별해야 할까요?from sklearn.metrics import f1_scoref1= f1_score(y_val, pred[:,1], pos_label='>50K') average=macro는 왜 붙이는건지 알수 있을까요? 혹시 macro나 pos_label처럼 뒤에 따로 붙여야 하는 평가지표가 있다면 또 알려주실수 있을까요?감사합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
하이퍼파라미터 튜닝 default값 문의
안녕하세요.하이퍼파라미터 튜닝 관련 질문있습니다. 강의에서는 XGBClassifier 하이퍼파라미터 튜닝값 의 기본값이 max_depth=3, learning_rate=0.1 이라고 말씀해주셨어요. 제 학습환경도 동일하게 코랩인데, 기본값이 다른 것 같아요. 결과를 비교해보니, 저는 max_depth=6, learning_rate=0.3이 기본값인 것 같고, gpt에 물어봐도 동일한 답변이 나옵니다. (아래 gpt답변 참고) 강의 촬영시점과 달라서 그런걸까요?시험환경에서는 기본값이 또 다를까요? 그러면 시험환경에서는 기본값 의존하지말고 그냥 하나하나 값을 직접 찍어보는게 좋을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
소괄호, 중괄호, 대괄호 사용법
(), {},[] 사용법 알려주세요. 너무 헷갈려요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
''와 "" 차이
df['메뉴'].isin(["녹차"])'메뉴', "녹차" 작은따옴표와 큰따옴표 차이가 어떻게 다른건가요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
함수 오류 모르겠어요
listbox = [15, 46, 78, 24, 56] def min_max(data): mi = min(data) ma = max(data) return mi, ma a, b = min_max(listbox) print(a,b)--------------------------------------------------------------------------- TypeError Traceback (most recent call last) /tmp/ipython-input-3854204748.py in <cell line: 0>() 5 return mi, ma 6 ----> 7 a, b = min_max(listbox) 8 print(a,b) /tmp/ipython-input-3854204748.py in min_max(data) 2 def min_max(data): 3 mi = min(data) ----> 4 ma = max(data) 5 return mi, ma 6 TypeError: max() takes 0 positional arguments but 1 was given학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!최대값, 최소값 구하는데 쌤하고 똑같이 했는데 왜 오류가 나지요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
melt 대괄호
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요melt함수에서 [ ] 대괄호를 붙인것도 안붙인 것도 있는데, id_vars는 꼭 붙인다 처럼 정해진 것이 있나요? var_namevalue_varsvalue_name
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
f1 score
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요target 값이 문자형일 경우 양성 레이블을 설정해줘야 하는 평가지표는 f1 score 밖에 없는 건가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
라벨인코딩을 했더니 F1 Score가 1.0이 나옵니다..
실제 시험에서 너무 정확한 점수(높은)가 나오면 과적합을 의심해야 할까요?import pandas as pd # 다중분류 문제 train = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p2/drug_train.csv") test = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p2/drug_test.csv") target = train.pop('Drug') # train, test 둘다 결측치 없고, 종류수 같음 cols = train.select_dtypes(include='object').columns # baseline # train = train.drop(cols, axis=1) # test = test.drop(cols, axis=1) # one-hot # train = pd.get_dummies(train, columns = cols) # test = pd.get_dummies(test, columns = cols) # Label from sklearn.preprocessing import LabelEncoder for col in cols: le = LabelEncoder() train[col] = le.fit_transform(train[col]) test[col] = le.transform(test[col]) # 학습 데이터 분리 from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split( train, target, test_size=0.2, random_state=0 ) # 모델 학습 from sklearn.ensemble import RandomForestClassifier model = RandomForestClassifier(random_state=0) model.fit(X_tr, y_tr) pred = model.predict(X_val) # 모델 성능평가 from sklearn.metrics import f1_score score = f1_score(y_val, pred, average='macro') print("F1 Score: ", score) # baseline F1 Score: 0.5535714285714286 # one-hot F1 Score: 0.8809523809523809 # Label F1 Score: 1.0 # 모델 예측 pred = model.predict(test) pd.DataFrame({ 'pred': pred }).to_csv('result.csv', index=False) pd.read_csv('result.csv')
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기 체험환경에서 결과값 관련 질문입니다.
필기 합격하고 실기 준비에 답답했었는데 강사님 덕분에 빅분기 실기 재밌게 잘 준비하고 있습니다. 실기 체험환경에서 유형3을 하고 있는데요.회귀분석에서 새로운 값을 가정했을 때,신뢰구간과 예측구간을 묻는 문제에서print(pred.summary_frame())이것의 결과값이 길어서 중간에 '...' 으로 나오는데 전부 다 보려면 어떻게 해야 되나요강의 어느 부분에서 방법을 말씀해 주셨었는데강의 어느부분인지 기억이 안나요..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
스케일링
혹시 스케일링에서는 인코딩과 다르게 for col in cols:를 따로 하지않아도 되는 이유가 있나요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션4. 이직 여부 예측 질문
코딩이 실행이 안되는 이유가 궁금합니다.import pandas as pd train = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p2/hr_train.csv") test = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p2/hr_test.csv") target=train.pop('target') train=train.fillna('X') test=test.fillna('X') df=pd.concat([train,test],axis=0) df=pd.get_dummies(df) train=train.iloc[:len(train)].copy() test=test.iloc[len(train):].copy() from sklearn.model_selection import train_test_split X_tr,X_val,y_tr,y_val=train_test_split(train,target,test_size=0.2,random_state=0) from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state=0) rf.fit(X_tr, y_tr) pred = rf.predict_proba(X_val) pred = rf.predict_proba(test)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제 4-3 8번
해당 문제를 아래와 같이 풀었습니다. # your code import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/main/p1/members.csv") df=df.fillna(method='bfill') df=df.groupby(['city','f2']).sum().reset_index() df=df[['city','views']].sort_values(by='views',ascending=False) df= df.reset_index(drop=True) df=df.loc[2:2] df print("대구")해당 마지막 코드인 df=df.loc[2:2]를 통해서 정답이 '대구'인걸 눈으로 확인했는데 해당 값만 추출하는 것을 몰라 마지막에 print를 활용해서 정답을 '대구'로 출력했는데 이와 같은 경우 괜찮은지 질문드립니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
bfill
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요df = df.fillna(method='bfill') df = df.bfill() ffill도 마찬가지로선생님, 왕초보의 질문인데요..! bfill과 fillna(method='bfill')이 완전히 똑같은 기능을 하나요?그렇다면, fillna(method='bfill') 가 조금 더 코드가 긴데, fillna 를 까먹지 않도록 이걸로 알려주시는 걸까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1_문제3
안녕하세요, 저는 알려주신 코드와 동일하게 작성한 것 같은데, 결과 값이 'id'로 나오는데 뭐가 문제일까요 import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p1/members.csv") df = df.isnull().sum() print(df.sort_values(ascending=False)) print(df.index[0]) 11:06초먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결측치 처리 관련 질문입니다.
train과 test의 결측치를 보면 object 컬럼들이 결측치가 많아 단순히 dropna를 시키면 문제가 있을까요?dropna로 test의 행의 사이즈가 달라지면 오답이 되나요?범주형 변수들의 결측치를 처리할때 X로 채우신 이유가 궁금합니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
한가지 방법으로 작업형 2 풀기 질문
안녕하세요 질 좋은 강의 올려주셔서 항상 감사합니다.몇가지 질문을 하고싶은데traget=train.pop('타겟') << 이거를 인코딩 하기 전에 하는것이 나을까요 아니면 검증데이터 분할하기 전에 하는것이 나을까요?학습시간이 촉박해서 그런데 인코딩에서 레이블인코딩을 학습하지 않고 그냥 원핫인코딩 하나만 학습해서 시험을 쳐도 무리 없을까요? 그리고 머신러닝 학습에서도 lightgbm이나 XGBoost나 다른 모델을 쓰지않고 그냥 랜덤포레스트 하나만 학습해서 시험을 쳐도 합격하는데는 큰 무리가 없을지 궁금합니다!감사합니다 추가적으로작업형 2에서 이상치 조정, 스케일링, 하이퍼 파라미터 튜닝 이 세가지 작업도 굳이 하지 않아도 점수에 큰 영향이 없다면 패스하고 싶은데 괜찮을지 여쭤봅니다!!
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
section12 2유형(2025)
문자형 데이터의 칼럼을 라벨, 원핫 인코딩 말고 삭제해도 괜찮을까요 ?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션12 작업형2 (2023년)
section12 작업형2 (2023년) 문제를 풀어보고 싶은데 링크를 누르면 영상 문제와 같은 문제가 아닌데 풀어볼 방법이 없을까요 ?