묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모의문제 작업형 2 코드 ㅠㅠㅠ 제가 작성한 코드에 어디에 문제가 있는것일까요?
import pandas as pdtrain = pd.read_csv("data/customer_train.csv")test = pd.read_csv("data/customer_test.csv")#print(train.shape, test.shape)#결측치 채우기train['환불금액']=train['환불금액'].fillna(train['환불금액'].median())test['환불금액']=test['환불금액'].fillna(test['환불금액'].median())# print(train.isnull().sum())#범주형컬럼 카테고리 수 확인하기cols=train.select_dtypes(include="O").columnsprint(cols)for col in cols: same=set(train[col].unique())==set(test[col].unique()) print(col,same)train=train.drop('회원ID',axis=1)test=test.drop('회원ID',axis=1)target=train.pop("총구매액")mid=len(train)#데이터 합치고 인코딩 후 다시 분할하기df=pd.concat([train,test],axis=0)print(df)#라벨인코딩하기from sklearn.preprocessing import LabelEncoderle=LabelEncoder()for col in cols: df[col]= le.fit_transform(df[col])# print(df.head(8))#다시 나누기train=df.iloc[:mid].copy()test=df.iloc[mid:].copy()print(train.shape, test.shape)#민맥스스케일링(추후)#train데이터 분할하기from sklearn.model_selection import train_test_splitX_tr, X_val, y_tr, y_val=train_test_split(train,target, test_size=0.2, random_state=100)# #모델구축(1) #707.539# from sklearn.ensemble import RandomForestRegressor# model=RandomForestRegressor(random_state=100)# model.fit(X_tr, y_tr)# pred=model.predict(X_val)#모델구축(2) 705.1955import lightgbm as lgbmodel=lgb.LGBMRegressor(random_state=0, verbose=-1)model.fit(X_tr, y_tr)pred=model.predict(X_val)#성능평가RMSEfrom sklearn.metrics import root_mean_squared_errorprint(root_mean_squared_error(y_val, pred)) 성능평가한 값이 선생님 결과랑 터무니없이 차이가 많이 나네요 ㅠㅠ어디가 잘못된걸까요
-
해결됨코딩 없이 AI 자동화 전문가가 되는 법, n8n 완벽 가이드
contab를 통해 클라우드 서버로 옮겼습니다
추천해주신 벌쳐와 비교해봤는데 contabo가 가격적으로 성능적으로 좋아보여서 contabo로 클라우드 서비스를 정해서 n8n을 설치하였고, ngrok으로 프리도메인까지 받았습니다. 혹시 여기선 강의에 있는 직접 만들어주신 유튜브 요약 api는 사용하지 못하겠죠?? 혹시 다른 api를 활용해 수업을 따라가볼수 있는지 궁금합니다! Epify 도 막힌 것 같아서요 ㅠㅠ노트북과 데스크톱 두 가지로 자주 왔다갔다 하며 강의를 듣기에, 계속 워크플로를 옮겨가며 하는 게 불편하고, 하나의 환경에서 듣고 싶어서 VPS를 구매했는데추가로 앞으로의 강의에서도 이 부분때문에 많이 막힐까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 하이퍼파라미터튜닝
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요하이퍼 파라미터 튜닝을 하는데 그리드서치를 써서 해도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
현재 체험환경에 있는 작업형 2번 문제 데이터는 concat해서 풀어도 되나요?
물론 범주형 카테고리가 다른것도 확인은 했지만 그래도 concat하고 분할해도 무방한가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이진분류에서 양성이 0일 때, roc_auc_score 적용..
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 안녕하세요 평가지표 중 roc_auc_score 학습 중에 궁금한 사항이 있어서 질문드립니다. 강의나 시나공, 기출 다 이진분류 0, 1 중 1을 양성으로 예측하는 문제가 있어서 반대로 0일 확률을 예측하고 평가하는 경우 어떻게 처리해야하는지 궁금해서요..!! rf = RandomForestClassifier(random_state = 0)rf.fit(X_tr, y_tr) 그리고 rf.classes_ 로 확인해보면 [0, 1] 일 때,y_pred_rf = rf.predict_proba(X_val) 그리고 roc_auc_score에서roc_auc_score(y_val, y_pred_rf[:, 0]) 이렇게 첫 번째 클래스(0일 확률)를 입력하면 자동으로 0을 양성으로 계산해서 모형평가가 이루어지는 건가요?아니면 pos_label = 0 이라고 지정을 하거나, 별도의 방법이 필요한가요?! 그리고 분류 클래스가 문자형(A, B)인 경우에는(rf.classes_도 [A, B])roc_auc_score(y_val, y_pred[: , 1]) 이렇게 하면 자동으로 B를 양성으로 인식하는 게 맞는지 궁금합니다 !! (이경우에도 A 확률을 평가하려면y_pred[:, 0]으로 하고 pos_label = 'A'라고 해야하는지도 ㅠㅜ) 감사합니다 :)
-
미해결[Rookiss University] Haker님의 UE5 소스코드 분석 시리즈 #1 (게임 프레임워크)
AActorComponent의 RegisterComponentWithWorld()에서 이어지는 Activate()에 관한 질문입니다
안녕하세요!Activate() 이후 PrimaryComponentTick.SetTickFunctionEnable()이 호출되는데,이후 GameWorld인지 Owner가 있는지 여부 등을 따져가며 RegisterAllComponentTickFunctions()를 호출할 때도 결국 SetupActorComponentTickFunction()을 통해 인자로 전달된 PrimaryComponentTick의 SetTickFunctionEnable()이 호출됩니다.왜 이렇게 같은 과정이 굳이 두 번이나 이루어지는지 궁금합니다물론 두 번째 단계에서는 등록 여부를 확인하여 걸러지지만 실행 조건을 살펴보아도 GameWorld가 아니라는 조건 때문에 두 번 실행될 가능성이 있는 것 같아 질문드립니다.읽어주셔서 감사드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
피벗테이블은 필수로 알아야하나요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요피벗테이블은 필수로 알아놔야할까요? 뭔가 더헷갈려서요... 언스택만 알아도 충분할지 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의고사
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요문제 아래쪽에 있는 코드를 모두 복사하라는데 그게 어딨나요..?
-
미해결토비의 클린 스프링 - 도메인 모델 패턴과 헥사고날 아키텍처 Part 1
iterm 설정 문의
안녕하세요. 강의 잘 보고 있습니다.다름이 아니라 cat .sdkmanrc로 file을 출력할 때 줄 번호와 같이 이쁘게 정돈되어 출력되는 것을 보고 기능을 찾아보고 있는데 무엇인지 잘 모르겠어서 질문 글에서 여쭤봅니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
클래스 불균형 질문드립니다.
기출 9회 작업2유형 풀이 코드입니다.# print(train.shape,test.shape) # (4000, 9) (1000, 8) # print(train.info(), test.info()) # float64(3), int64(2), object(4), float64(3), int64(1), object(4) # print(train.nunique(), test.nunique()) # 농업면적 4000, 비료사용량 3997, 비료잔여량 4000 # print(train.head(30)) # train = train.drop(columns = '농업면적') # test = test.drop(columns = '농업면적') # train = train.drop(columns = '비료사용량') # test = test.drop(columns = '비료사용량') # train = train.drop(columns = '비료잔여량') # test = test.drop(columns = '비료잔여량') # target = train.pop('농약검출여부') from sklearn.preprocessing import LabelEncoder le = LabelEncoder() cols = train.select_dtypes(include = 'O').columns for col in cols: train[col] = le.fit_transform(train[col]) test[col] = le.transform(test[col]) from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size =0.2, random_state = 0) from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state = 0, max_depth = 11, n_estimators = 200, class_weight = 'balanced') rf.fit(X_tr, y_tr) pred = rf.predict(X_val) from sklearn.metrics import f1_score, accuracy_score, recall_score print('f1 : ', round(f1_score(y_val, pred, average = 'macro'), 3)) print('acc : ', round(accuracy_score(y_val, pred), 3)) print('recall : ', round(recall_score(y_val, pred, average = 'macro'), 3))처음 학습을 진행할 때 랜덤포레스트에 class_weight 하이퍼파라미터는 적용하지 않은 상태에서 학습을 진행했고, f1 : 0.887 acc : 0.97 recall : 0.848이라는 높은 수치가 나왔습니다.GPT 확인해보니 accuracy_score 점수가 f1_score 점수보다 높으면 과적합 문제가 있을 수도 있다고해서확인을 해보니 과적합 문제는 아닌 것 같았습니다. 이후에 train['농약검출여부'].value_counts()를 해보니 클래스 불균형으로 판단을 했습니다.(농약검출여부 = (2 : 1989, 0 : 1758, 1 : 253)) 확인 후에 class_weight 하이퍼 파라미터를 추가했는데도 수치가 크게 달라지지 않더라구요.f1 : 0.856 acc : 0.945 recall : 0.887이런 경우에는 그냥 제출하는게 맞을까요 ? 지난 9회차 시험에 평가지표 수치가 높게 나오긴 했는데 만점은 받았거든요..그래도 수치가 높으면 좀 불안하네요..
-
해결됨한 입 크기로 잘라먹는 Next.js(v15)
vercel 배포중 문제가 생겼습니다
vercel 배포중 문제가 발생합니다 빌드중에는 아무런 문제가 없는데 해당이미지 처럼 빌드에서 문제가 생긴다고 합니다 빌드 로그 부분인데 해당부분을 오른쪽 부분처럼 promise로 바꿔도 보고 왼쪽처럼 사용을해봐도 똑같아서 그러는데 제가혹시 다른부분을 고치고 있는건지 어떻게 고쳐야할지 궁금해서 문의해봅니다
-
해결됨[자바/Java] 문과생도 이해하는 DFS 알고리즘! - 입문편
질문있습니다.
혹시 이런 유형에서 N 이 크면 ArrayList 를 사용해야하는데 2차원 배열 어레이 리스트 사용은 어떤식으로 하나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5회 기출문제 수업질문입니다
질문 여기다 드리면 되나요 샘 코드 한번만 봐주세요 오늘 강의 들어왔어요 ㅠㅠ 진작했어야했는데요 에러는 안났느데 답 수치가 달라서요import pandas as pdtrain=pd.read_csv("train.csv")test=pd.read_csv("test.csv")# print(train.info())# print(test.info()) from sklearn.preprocessing import LabelEncoderle= LabelEncoder()cols= ("model", "transmission", "fuelType")for col in cols:le.fit(train[col])train[col]= le.transform(train[col])test[col]= le.transform(test[col])from sklearn.model_selection import train_test_splitX=train.drop(columns=["fuelType", "price"])y=train["price"]X_train, X_test, y_train, y_test=train_test_split(X, y, test_size=0.2, random_state=20)print(train.shape)print(test.shape)from sklearn.ensemble import RandomForestRegressorrfr=RandomForestRegressor(n_estimators=400, max_depth=30, random_state=20)rfr.fit(X_train, y_train)pred1=rfr.predict(X_test)print(pred1)from sklearn.metrics import root_mean_squared_errorrmse= root_mean_squared_error(y_test, pred1)print("rmse:", rmse)test_X=test.drop(columns=["fuelType"])pred2=rfr.predict(test_X)pd.DataFrame({"pred":pred2}).to_csv("result.csv", index=False)print(pd.read_csv("result.csv"))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
labelencoder 질문
target = train.pop('Heat_Load') cols = ['Roof','Height','Orient', 'Heat_Load'] from sklearn.preprocessing import LabelEncoder for col in cols: le = LabelEncoder() train[col] = le.fit_transform(train[col]) test[col] = le.transform(test[col]) 영상처럼 원핫인코딩을 진행하면 오류가 없는데 라벨인코딩 진행시 오류가 납니다 ㅠㅠ KeyError: 'Heat_Load' 이렇게 뜨는데 어떻게 해결해야 하나요?
-
해결됨한 입 크기로 잘라먹는 타입스크립트(TypeScript)
맥북 코드 에디터(vscode 또는 cursor)에서의 한글 입력 씹힘 오류
정환님께서 강의에서 주석에 한글 달아서 설명해 주실 때는 스무스하게 잘 입력되는 거 같은데 왜 제 맥북에서는 한글 입력 할 때 자음이 씹히거나 자음 모음이 이어지지 않는 현상이 생길까요? ㅜㅜ 구글링해도 해결책이 안나오는데 혹시 비슷한 경험이나 해결법 있으신가요?
-
해결됨[UI3 업데이트] 피그마 배리어블을 활용한 디자인 시스템 구축하기
타이포그래피 네이밍 관련해서 궁금한게 있습니다.
🔍 상황현재 타이포그래피 스타일 명명 방식에 대해 고민이 있습니다. 개발자 측에서는Display1-Bold 와 같이 위계 중심의 토큰 네이밍을 선호합니다.코드 연동 시에는 스타일명이 그대로 토큰으로 등록되기 때문에40px 같은 구체적인 수치를 굳이 명칭에 포함할 필요가 없고,오히려 수치가 변경될 경우 네이밍까지 수정해야 하는 유지보수 이슈가 발생합니다.디자이너 측에서는Figma 내에서 스타일을 빠르게 식별하고 사용하기 위해Display1-Bold-40px처럼 사이즈가 명시된 스타일 네이밍을 선호합니다.수치가 함께 있어야 작업 중 빠르게 위계를 파악하고 적용하기 수월하다는 의견이 있습니다. 🙋🏻 질문이러한 상황에서 다음과 같은 고민이 있습니다: 디자이너가 스타일 명에서 수치를 보고 싶은 니즈와개발자는 위계 중심의 명칭을 유지하고 싶은 니즈를동시에 충족시킬 수 있는 구조가 있을까요?예를 들어 Figma 내에서 디자이너는 Display1-Bold-40px처럼 수치를 보고 작업하되,코드로 내보낼 때는 Display1-Bold로만 연동되는 방식이 가능한지,혹은 실제 조직에서는 이런 상황을 어떻게 운영하고 있는지 궁금합니다.
-
미해결[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
범주형 인코딩
범주형 인코딩을 할 때 아래 코드를 사용한다고 강의에서 말씀하셨습니다.le_product = LabelEncoder()le_store = LabelEncoder()train['주구매상품_encode'] = le_product.fit_transform(train['주구매상품'])train['주구매지점_encode'] = le_store.fit_transform(train['주구매지점'])test['주구매상품_encode'] = le_product.fit_transform(test['주구매상품'])test['주구매지점_encode'] = le_store.fit_transform(test['주구매지점']) 그런데 test 데이터에서 인코딩을 할 때 train에서와 같은 기준으로 인코딩을 해야 하니까, test에서는 fit_transform이 아니라 그냥 transform을 하는게 더 적절하지 않은지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 기출
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요작업형1의 기출을 풀고 있습니다. 저는 주로 '~~기준 ~~번째로 큰 데이터의 ~~을 구하시오'라는 문제를 풀 때 그 값을 기준으로 sort_values를 하고 그에 따라 맞는 행과 컬럼을 iloc로 답을 구하고 있습니다. 강사님과 답은 똑같은데 제 방식대로 계속 하면 될까요?
-
미해결Vue3 완벽 마스터: 기초부터 실전까지 - "실전편"
@click.prevent="params._page = pageNum"> 에 .value를 안쓰는 이유가 궁금합니다.
ref로 선언한 객체(params)는 일반적으로 params.value._limit처럼 .value로 접근해야 하는데,왜 <a @click.prevent="params._page = pageNum">와 같은 템플릿 안에서는 .value 없이도 작동하는건가요?그런데 위처럼 .value를 사용하면 오히려"Cannot set properties of undefined (setting '_page')" 에러가 나는 이유는 무엇인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
제2유형 전처리작업
제2유형 전처리 작업할 때, 결측치 - 중앙값 또는 0 처리 / 환불금액의 경우 상식적으로 환불을 안하는 사람이 있으니 0 처리가 맞을듯 범주형(문자열) - drop 진행 안하고 그대로 원핫인코딩만 진행하려고합니다. 상관 없을까요?