묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
NMS 로직 문의 드려요
안녕하세요 NMS 이해에서 NMS 수행로직 설명하시는 부분에서요Confidense score가 높을수록 많으 박스가 제거 된다고 하는데 Confidence score인지 Confidence threshold인지 헷갈립니다. threshold가 높아야 이 threshold보다 낮은 박스들은 모두 제거 되지 않을까 해서요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 강의 업데이트 관련
섹션5에 작업형2 강의 내용이 새로 업데이트되었던데, 얼마전에 업데이트 되기전 강의를 다 보았어서요, 업데이트 전과 후가 많이 달라졌나요?? 다시 강의를 듣는게 좋을까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
검증데이터 분할
검증데이터 분할을 할 때 왜 gender를 drop하나요?from sklearn.model_selection import train_test_splitX_train,X_val,y_train,y_val =train_test_split(train.drop('gender',axis=1),train['gender'],test_size=0.2,random_state=0)print(X_train.shape,X_val.shape,y_train.shape,y_val.shape)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
pos_label 사용 여부
pred 컬럼 명이 0또는1이 아니라 문자일 때 컬럼을 선택해주기 위해서 pos_label을 사용해준다고 하셨는데 모든 평가지표에서 pos_label을 사용해야 하는지와 pos_label을 써서 컬럼을 선택해줬는데, 실제 값을 예측할 때 {'pred':pred[:,1]}을 해주는게 맞는지 궁금합니다 이미 한 컬럼이 선택됐는데 범위를 지정할 경우 이상이 없을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
target 지정하는 방법
pop 이용하지않고 제가 쓴 것처럼 저런 코드로 target 지정하면 추후에 어디에 문제가 발생할까요?import pandas as pd train=pd.read_csv("train.csv") test=pd.read_csv("test.csv") #분류문제이고 랜덤으로 할것이다. #전처리 필요없음 (결측치없음) #basic 수치형데이터만 활용 train.info() target=train['Segmentation'] train=train[['Age','Work_Experience','Family_Size']] test=test[['Age','Work_Experience','Family_Size']] from sklearn.ensemble import RandomForestClassifier model=RandomForestClassifier() model.fit(train,target) pred=model.predict(test) pred
-
해결됨(2025) 일주일만에 합격하는 정보처리기사 실기
6:45 생성자가 있는지 없는지
유형2의 문제인데요. 생성자가 있는지 없는지 판단하는걸 어떻게 하는거죠?class가 있으면 생성자가 있는 거 아닌가요 ㅠ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 기출유형 작업형3 문제 1-1 "0.05 이상" 문의
8회 기출유형 작업형3 문제 1-1 "0.05 이상"이면은 >=로 찾아야 하는게 아닌가요? 영상에서는 >로 작성하셔서 문의드립니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출4 작업형1 1번째문제에서 결측값을 마음대로 제거하고 구하면 안되는거죠?
3사분위수와 1사분위수의 차를 구하는 문제에서결측값이 있는 컬럼들의 결측값을 제거한 후에 즉 전처리를 한후에 답을 구하면 안되는거죠?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
y_test로 실제 채점을 해보려는데 오류가 나네요 ㅠ어디가 문제일까요
import pandas as pd train=pd.read_csv("train.csv") test=pd.read_csv("test.csv") print(train.shape) print(test.shape) train.info() cols=train.select_dtypes(include="O").columns cols from sklearn.preprocessing import LabelEncoder le = LabelEncoder() for col in cols: train[col] = le.fit_transform(train[col]) test[col] = le.transform(test[col]) target=train.pop("TravelInsurance") #데이터분할하기 from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=2022) from sklearn.ensemble import RandomForestClassifier model = RandomForestClassifier(n_estimators=800,max_depth=9,random_state=2022) model.fit(X_tr,y_tr) pred=model.predict_proba(X_val) from sklearn.metrics import roc_auc_score print(roc_auc_score(y_val,pred[:,1])) pred=model.predict_proba(test) print(test.shape) print(pred.shape) submit= pd.DataFrame({ "index":test.index, "pred" :pred[:,1] }) submit.to_csv("9999.csv",index=False) y_test=pd.read_csv("y_test.csv") roc_auc_score(y_test,pred)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
정말 기본적인것만 외우고 레이블인코딩으로 해서 돌려봤는데요
혼자 드디어 처음으로 외워서 작성해본 2유형코드입니다~ 평가점수가 저정도 나오는데 아무래도 수치형을 스케일링하지않아서 일까요? 아니면 원핫인코딩이 더 적절한거였을까요?아니면 저정도 점수여도 안전한 구역일까요?import pandas as pd train=pd.read_csv("train.csv") test=pd.read_csv("test.csv") print(train.shape) print(test.shape) train.info() cols=train.select_dtypes(include="O").columns cols from sklearn.preprocessing import LabelEncoder le = LabelEncoder() for col in cols: train[col] = le.fit_transform(train[col]) test[col] = le.transform(test[col]) target=train.pop("TravelInsurance") #데이터분할하기 from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=2022) from sklearn.ensemble import RandomForestClassifier model = RandomForestClassifier() model.fit(X_tr,y_tr) pred=model.predict_proba(X_val) from sklearn.metrics import roc_auc_score print(roc_auc_score(y_val,pred[:,1])) #0.7486363636363635
-
미해결Airflow 마스터 클래스
dag 에러났어요
Broken DAG: [/opt/airflow/dags/dags_bash_operator.py] Traceback (most recent call last): File "<frozen importlib._bootstrap_external>", line 1063, in source_to_code File "<frozen importlib._bootstrap>", line 488, in callwith_frames_removed File "/opt/airflow/dags/dags_bash_operator.py", line 24 bash_t1 >> bash_t2 ^ IndentationError: unindent does not match any outer indentation level 이런 에러가 났는데요소스에서 확인해보니from airflow.operators.bash import BashOperator ㅇairflow.operators.bash 에 ~~~~~~ 이렇게 되어 있네요. 강사님 따라 그대로 했는데 에러가 왜 난걸까요?
-
해결됨[파이썬/Python] 문과생도 이해하는 DFS 알고리즘! - 입문편
백준 13565 침투 질문
강의 정말 잘 듣고있습니다. DFS 너무 어려웠는데 저에게 한 줄기 빛 같은 존재십니다..! 원본 문제가 바뀐것같기도 한데,13565번 백준 원본을 보면 M, N 순서대로 입력을 받는 것 같습니다. M이 행에 해당되고, N이 열에 해당이 되어서 전반적으로 반대가 되어야하고,강의에서 말씀 주신 이 부분도defdfs(y, x): global visited, map_, answer, N if y == N: answer = Truereturny == M으로 바뀌어야할 것 같은데 맞을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 이 문제는 데이터가 3개 주어졌다고 치고 풀어보는건가요?
다른 문제들에서는 train과 test데이터 두개만 주어진채로 계속 들은거같은데 이 문제는 주어진 데이터가 3개인건지..제가 앞서 이해했던 문제들의 데이터는 train데이터를 가지고 분할하고 모델링을 한후 validation한 데이터로 pred값을 구하고 실제값과 비교해서 지표로 매겨본후에 최종 test데이터를 넣어서 csv파일로 만드는 순서인데.. 지금 이 문제처럼 데이터가 3개인것은 어떤 차이가있는 것일까요 ㅠㅠ
-
미해결프로그래밍 시작하기 : 파이썬 입문 (Inflearn Original)
강의자료 부탁드립니다. 미리 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 문제 형식 문의
실제 시험 문제에서도 큰 제목으로 '다중 선형 회귀' 이렇게 제시해주는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩 object 컬럼선택 기준
안녕하세요!앞선 강의와 예제들로, id컬럼같은건 머신러닝에 긍정적인 영향을 주지않고 삭제해도 학습에 무방하다고 단순히 이해했습니다. 원핫인코딩 예제때 item_id 삭제에 대해선 설명주시긴 했지만, 모든 상황에서 Id컬럼은 제외한채 뒷 단계를 진행하는것에 고려사항이 있을지 문의드립니다. cols = ['Item_Fat_Content','Item_Type',' Outlet_Size','Outlet_Location_Type ','Outlet_Type']*Item_Identifier/Outlet_Identifier 은 제외 # Column Non-Null Count Dtype --- ------ -------------- ----- 0 Item_Identifier 6818 non-null object 1 Item_Weight 5656 non-null float64 2 Item_Fat_Content 6818 non-null object 3 Item_Visibility 6818 non-null float64 4 Item_Type 6818 non-null object 5 Item_MRP 6818 non-null float64 6 Outlet_Identifier 6818 non-null object 7 Outlet_Establishment_Year 6818 non-null int64 8 Outlet_Size 4878 non-null object 9 Outlet_Location_Type 6818 non-null object 10 Outlet_Type 6818 non-null object 11 Item_Outlet_Sales 6818 non-null float64 dtypes: float64(4), int64(1), object(7) memory usage: 639.3+ KB
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 모의고사 문제 환경
작업형 모의고사 노트북링트는 어디에 나와있나요? 코랩에서 문제를 보려고 하는데 찾을 수 없네요ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
머신러닝 강의 업데이트 관련
안녕하세요.머신러닝 신규 강의 업데이트가 완료됐다는 공지를 봤는데요.회귀 관련 강의가 없는데 확인 요청드립니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코랩 자동완성 끄기
문제풀이에 방해되어서 코랩 자동완성 기능을 끄고 싶은데요.알려주신 [도구>설정>편집기>‘컨텍스트 기반 코드 완성 표시‘ 해제 > 저장] 진행 했음에도 불구하고, 계속해서 자동완성이 되어서 학습에 방해가 되고 있습니다.ㅠㅠ 자동완성 끄는 다른 설정 방법이 있는지 알려주세요.
-
해결됨38군데 합격 비법, 2025 코딩테스트 필수 알고리즘
문자열 뒤집기 문제 질문입니다!
1. 현재 학습 진도몇 챕터/몇 강을 수강 중이신가요?1-11 def find_count_to_turn_out_to_all_zero_or_all_one(string): # string을 순회하면서 0과 1의 연속된 덩어리 개수를 구함 # 그 개수중 min을 return zero_seq = 0 one_seq = 0 prev_num = string[0] # 첫 bit 초기화 if string[0] == "0": zero_seq += 1 else: one_seq += 1 # 2번째 bit부터 마지막까지 순회 for bit in string[1:]: if bit != prev_num: if bit == "0": zero_seq += 1 else: one_seq += 1 prev_num = bit min_count = min(zero_seq, one_seq) return min_count result = find_count_to_turn_out_to_all_zero_or_all_one(input) print(result)안녕하세요!1주차 숙제 중 문자열 뒤집기 문제를 풀면서 궁금한 점이 있어 질문 남깁니다.저는 풀이가 위 코드와 같이 나왔는데, 정답 코드랑 비교했을때 살짝 다르더라구요.출력은 잘 나오는 것 같은데, 정확한 차이가 궁금합니다.저는 현재 bit를 이전 bit와 비교하고, 강사님은 현재 bit를 다음 bit와 비교하는 방식의 차이일까요?아니면 제 풀이에 문제가 있을까요?