묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 시험에서
csv파일 제출 시data.to_csv('result.csv', index=False)이렇게 csv파일로 만들고 제출버튼 누르면 정상적으로 제출 완료되는게 맞죠..??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 관련 질의 (pop, train_test_split)
train_target=train.pop('TotalCharges') # 3. 분할 from sklearn.model_selection import train_test_split tr_x, val_x, tr_y, val_y =train_test_split(train,train_target, test_size=0.2, random_state=0)# 3. 분할 from sklearn.model_selection import train_test_split tr_x, val_x, tr_y, val_y =train_test_split(train,train['TotalCharges'], test_size=0.2, random_state=0) tr_x.head(), tr_y.head(), val_x.head(), val_y.head()위 두가지 경우로 모델링 하여 MAE값을 산출했습니다.아래꺼는 Linear Regression : 0.0000000000012394228 RandomForest Regressor : 1.9100924757282742306 XGB Regressor : 10.5623083675717790442 위에꺼는 Linear Regression : 914.6725879047844500747 RandomForest Regressor : 941.4584990860494144727 XGB Regressor : 1033.3863728784358499979 왜 이렇게 다른 결론이 나올까요?해당 내용만 변경하고, 나머지 코드는 모두 동일한 상태에서 구동했습니다.
-
해결됨웹소켓/STOMP 채팅서비스(spring, vue, redis)
수강료가 갑자기 인상됬던데 ㅠ
개발자라면 알아야 할 redis 기본개발자라면 알아야 할 리눅스(linux-ubuntu) 기본 이거 두강좌 굉장히 저렴했던걸로 기억하는데 지금은 많이 올라갔네요 기존 수강생에게 이전 저렴한 가격으로 구입할수있는 할인쿠폰을 발행해주실수없으신지요? 괜히 가격인상됬다하니 구입하고싶은마음이 생겨났습니다. DB를 MYSQL을 사용하기에 선생님 강의 MYSQL둘다 구입했는데 그래서 REDIS가 뭔지 몰라서 관심밖이였었거든요 그리고 새로 개강한 eks를 활용한 spring 운영서버 배포(feat. devops의 모든것) 이강좌는 제가 구입해도될런지 잘모르겠습니다. 스프링부트로 게시판한번 만들어봤는데... 그단계의 연장선상인가요??? 빠르게 배우는 Spring Cloud 기초(MSA)이강좌를 들어야만 새로개강한강좌를 이해할수있는건지요??? 스프링부트로 웹사이트만들어서 창업목적을 두고있는 사람입니다. 취업목적이아니라...
-
해결됨350개의 개인 앱을 만들어 월급의 7배 수익을 달성한 방법
계정분산은 어떻게 하는건가요?
하라고 강의에는 있는데 어떻게 하란 이야기가 빠져있습니다. 전화번호만 같아도 줄줄이 사탕으로 같이 정지된다고 강의에서 말했는데 어떻게 관리하란건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제 2-2 오즈비 계산
# 1) 오즈비 계산 import numpy as np 1. np.exp(-0.3558) : 0.7006127287696858 2. np.exp(model.params['HasPhoneService']) : 0.7005907598948918 영상에서는 2처럼 풀이하셨는데 1로 풀어도 괜찮을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코드 오류
import pandas as pd # train = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/main/p2/ab_nyc/train.csv") # test = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/main/p2/ab_nyc/test.csv") train = pd.read_csv("train.csv") test = pd.read_csv("test.csv") # print(train.shape, test.shape) # (39116, 16) (9779, 15) # 1. 문제 정의 # 회귀 문제, target = price # 평가: R-Squared, MAE, MSE, RMSE, RMSLE, MAPE # 2. 데이터 불러오기 # 3. 탐색적 데이터 분석 # train.info() # dtypes: float64(3), int64(7), object(6) # test.info() # dtypes: float64(3), int64(6), object(6) # train.describe(include='O') # unique: 38447 # test.describe(include='O') # unique: 9718 # train.nunique() # test.nunique() # train.isnull().sum() # last_review, reviews_per_month 결측치 # test.isnull().sum() # name, host_name, last_review, reviews_per_month # 4. 데이터 전처리(인코딩) # 4-1. 결측치 처리(결측치 컬럼 삭제) cols = ['name', 'id', 'host_name', 'last_review', 'reviews_per_month'] train = train.drop(cols, axis= 1) test = test.drop(cols, axis = 1) # 4-2. 인코딩(원핫인코딩 사용) train = pd.get_dummies(train) test = pd.get_dummies(test) # 5. 검증 데이터 나누기 from sklearn.model_selection import train_test_split target = train.pop('price') X_tr, X_val, y_tr, y_val = train_test_split( train, target, test_size=0.15, random_state=0 ) # 6. 모델 학습 및 평가 # from sklearn.ensemble import RandomForestRegressor # rf = RandomForestRegressor(random_state=0) # rf.fit(X_tr, y_tr) # pred = rf.predict(X_val) from sklearn.linear_model import LinearRegression lr = LinearRegression lr.fit(X_tr, y_tr) # 평가: R-Squared, MAE, MSE, RMSE, RMSLE, MAPE from sklearn.metrics import r2_score, mean_absolute_error, mean_squared_error r2_score = r2_score(y_val, pred) mae = mean_absolute_error(y_val, pred) mse = mean_squared_error(y_val, pred) rmse = rmse(y_val, pred) rmsle = rmsle(y_val, pred) mape = mape(y_val, pred) # 7. 제출 pred = rf.predict(test) pd.DataFrame({'id':test_id, 'price': pred}).to_csv('00000.csv',index=False)안녕하세요혼자 풀이를 해보다가 모델 학습 단계에서 계속 오류가 나고 1분이 넘어가서 이유를 모르겠습니다..오류가 나는 이유와 전체적인 코드(저렇게 제출을 해도 시험에 문제가 없는지 ..) 한 번 봐주시면 감사하겠습니다...
-
미해결게임 엔진을 지탱하는 게임 수학
예제 13_4 {VM행렬을 사용하여 평면의 방정식을 로컬 좌표로 생성하기
13장 절두체에 대해 공부하다가 예제 13_3, 13_4로 넘어가는 중다음과 같이 학습 내용을 정리하게 되었는데, 제가 갖은 의문이 타당한 것인지, 잘못된 추론인지 알고싶어 문의드립니다. -정리 내용-예제 13_3에서는 뷰 공간에서의 영역 판정을 위해 원근 투영 행렬을 사용해 평면의 방정식을 만들었는데, 사실 뷰 공간 역시 모델링 행렬과 뷰 행렬을 로컬 좌표에 곱한 갑으로 분해하여 표현할 수 있다. 정리해 본다면 수식은 다음과 같이 나타난다.V(clip)-> = Dot(P,V(view)->) == Dot(P V M, (V(local)->))이 수식을 통해 절두체 컬링을 수행할 때 로컬 공간에서의 평면의 방정식을 만들 수 있고, 이 평면의 방정식과 캐싱된 바운딩 볼륨을 비교하여 컬링 대상인지 아닌지를 빠르게 판단할 수 있다는 것을 알 수 있다.또한 추가적인 장점도 있다. 특수한 경우(화각을 직접 조정하는 경우)가 아니라면 절두체 공간은 회전변환과 이동 변환만을 수행한다.대부분의 경우 로컬 공간의 평면의 방정식을 캐싱해두고 사용할 수 있다는 소리다. 단점은 모델링 행렬 자체가 변환되는 경우이다. 본질적으로 평면의 방정식을 로컬 공간으로 변환해서 비교한다는 것은 각 오브젝트 마다 서로 다른 평면의 방정식을 가지고 있다는 소리가 된다.(모델링 행렬은 각 오브젝트마다 전부 다르므로)또한 뷰 공간으로 변환하여 비교를 하던지, 로컬 공간에서 비교를 하던지 어차피 해야하는 계산이라는 것은 변하지 않는다는 것이다. 이 단점을 커버하는 것이 아마도 Static 오브젝트 설정인 것으로 나는 추측한다. 정적 게임 오브젝트는 그 형태가 변하지 않는 불변의 객체이므로, 모델링 행렬이 변하지 않는다. 그렇다면 이 오브젝트에 대해서는 항상 같은 로컬 공간의 평면의 방정식이 형성되고, 캐싱되어 사용할 수 있기 때문에, 카메라의 현재 설정값에만 영향을 받아 바운딩 볼륨을 언제나 즉시 비교할 수 있다는 것을 알 수 있다.
-
미해결한 입 크기로 잘라먹는 Next.js(v15)
7-1 개인적인 궁금증이 생겼습니다
이번 장에서 서버액션에 관한 내용을 들었는데 유지보수 측면에서 이 기술이 좋은 방법일까 하는 의문이 들었습니다!아래는 이런 경우가 생기지 않을까 해서 적어둔 내용입니다.서버액션으로 프론트에서 "a를 오른쪽으로 옮겨주세요" 라는 api를 백엔드에 만들었습니다.그런데 기존의 백엔드 api에선 a는 왼쪽으로 옮기는 스크립트를 만들어놨는데 서버액션으로 인해 백엔드 서버엔 예정에 없던 동작이 발생했습니다.그러다 나중에 a를 오른쪽으로 옮긴것에 대해 문제가 발생해서 백엔드 코드를 하루 꼬박 세면서 뒤져봤는데 오류를 못 찾았습니다그런데 알고보니 프론트에서 서버액션으로 보내는 a를 오른쪽으로 옮겨라는 코드 때문에 발생한 문제였습니다. 이런 상황이 실무에서 발생할거 같다는 생각이 들어서 이 서버액션 기능을 실제로도 많이 사용하는지 궁금합니다!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실제 시험장 summary
실제 시험장 summary를 쓸수없나요??실제 시험환경에서 summary()를 하니까 데이터가 안나와서 여쭤봅니다
-
해결됨[Rookiss University] UE5 Lyra 클론 코딩 (Haker)
부록 공부 굳이 해야 할까요?
부록 공부 굳이 해야 할까요? 부록이 왜 있는건지 잘 이해가 안가요.. 똑같은 내용을 복습하는건가요? 만약에 한번만 공부한다고 하면 Haker님 영상을 참고하는게 좋을까요 아니면 부록 영상을 참고하는게 더 효율적일까요? 다 들으면 60시간이고 Haker님 강의, 부록강의 둘 중에 하나를 배우고 쭉 복습하는게 더 효율적이라는 생각이 들어서요
-
해결됨Windows 시스템 프로그래밍 - 기본
메모리 맵과 비동기 입/출력 조합 #2 수업내용에 질문있습니다.
코드상에 보면COPY_DATA* pCopyData = (COPY_DATA*)malloc(sizeof(COPY_DATA)); pCopyData->pMapView = pszMemory; pCopyData->hMap = hMap; pCopyData->hFileSource = hFileSource; pCopyData->hFileTarget = hFileTarget;이부분에 이렇게 중첩되어서 보내는 정보를 저장하는걸 볼 수있는데. 맵핑객체를 가리키는 포인터인 pszMemory가 있는데 따로 매핑객체의 핸들이나 다른 파일들의 핸들또한 멤버로 넘겨주는 이유가 있나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
csv 개수 차이
안녕하세요.강의에서 csv 2, 3개 차이가 있다고 하셨는데, 어떤 차이와 코드를 작성하는데 어떤 차이가 있는지 문의드립니다. 감사합니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가하지 않고 한 가지 방법 질문 있습니다.
안녕하세요 저번에 평가하지 않고 랜덤포레스트 한개로만 제출한다고 했을 때에 그러면은 인코딩까지 동일하게 하고rf.fit(X_tr, y_tr)을rf.fit(train, target)으로 바꾸고pred = rf.predict(X_val)을pred = rf.predict(test)로 바꿔서target = train.pop('농약검출여부')train = pd.get_dummies(train)test = pd.get_dummies(test)train, test = train.align(test, axis=1, join='left', fill_value=0)from sklearn.ensemble import RandomForestClassifier-------------------------------------rf = RandomForestClassifier(random_state=0)rf.fit(train, target)pred = rf.predict(test)result = pd.DataFrame({'pred':pred})result.to_csv('result.csv',index=False)랜덤포레스트 기준 요런식으로 작성하면 되는지 궁금합니다.글구 쌤께서 target = train.pop할때 항상 인코딩하기 전에 하는데 이유가 있는지 궁금합니다!항상 이해 잘되게 가르쳐 주셔서 감사드립니다. 선생님
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코드 작성 질문
앞쪽 강의에서는from scipy import statsstats.shapiro(~~) 라고 설명해주셨는데이원 분산 분석 강의에서는from scipy.stats import shapiro로 라이브러리를 불러오네요 두 코딩에 차이가 있을까요?
-
미해결[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
항상 모델학습하실때 train_test_split일부러 안하시는 이유가 있는건가요?
항상 모델학습하실때 train_test_split일부러 안하시고 바로 모델에 X_train학습 시키는 이유가 있는건가요? 이러면 과적합 문제가 발생할수 있지 않나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀랜덤포레스트 max_depth
# 데이터 불러오기 import pandas as pd train = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/7_2/mart_train.csv") test = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/7_2/mart_test.csv") # EDA # total이 target컬럼 # train.shape, test.shape (700,10) // (300,9) # print(train.head(3)) target = train.pop('total') # print(train.shape) # print(train.info()) rating 제외 모두 object # print(train.describe(include="O")) # print(test.describe(include='O')) # unique 수 일치, 레이블 인코딩 활용 # print(train.isnull().sum().sum()) # print(test.isnull().sum().sum()) # 결측치 0개 # 전처리 from sklearn.preprocessing import LabelEncoder le = LabelEncoder() cols = train.select_dtypes('object').columns for col in cols : train[col] = le.fit_transform(train[col]) test[col] = le.transform(test[col]) # print(test.head(3)) # 레이블인코딩 완료 # 데이터 분할 from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.142, random_state=0) X_tr.shape, X_val.shape, y_tr.shape, y_val.shape # 평가 및 검증 (회귀) 랜덤포레스트 from sklearn.metrics import root_mean_squared_error from sklearn.metrics import r2_score from sklearn.ensemble import RandomForestRegressor rf = RandomForestRegressor(random_state=0, max_depth=1) model = rf.fit(X_tr, y_tr) pred = model.predict(X_val) print(root_mean_squared_error(y_val,pred)) # basic : 403187.3131420301 # max_depth=8 : 389483.9937048198 # max_depth=1 : 355335.1208784505 # print(r2_score(y_val,pred))위는 제가 작성한 코드인데, 베이직에서 약 40만의 rmse가 나왔습니다.후에 max_depth=8부터 튜닝을 시도했는데 depth를 올리는게 아닌 최솟값인 1까지 내렸을 때 최적의 rmse가 나오더라구요.이런 모델을 만들어본적이 없어서.. 혹시 제가 코딩한 모델이 잘못된건가 의문이 들어 질문드립니다! 정상적인 걸까요...?
-
해결됨Flutter 초입문 왕초보편
124강 DB에 Todo 등록
124강 DB에 Todo 등록 영상 뒷부분이 잘린것 같은데 의도하신 건가요? 아니면 잘린건가요??..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
다중선형회귀 질문입니다.
만약 적합된 회귀모델의 회귀계수 중 가장 큰 값을 물었을때, Intercept를 포함하는지, 음수는 작은 값이 맞는지 (상관계수 처럼 절댓값으로 고려하지 않아도 되는지) 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출7 작업형1 문제2 질문
corr을 사용할때는 꼭 절댓값을 같이 사용해주어야하나요?(abs)현재 제 풀이처럼 상관관계를 close기준으로 내림차순 정렬한 후에 시리즈를 눈으로 확인해서, DE중에 가장 높이 있는 컬럼을 평균내어 풀이하는 방식은 너무 야매인가요..??ㅋㅋㅋ...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 연장 문의
안녕하세요작년에 할인할때 구매했다가, 필기를 올해 4월이 되어서야 합격하면서 해외출장으로 인해 6월 초부터 수강하다가금주 시험을 앞두고 집안행사로 금일 접수 취소를 했습니다.교재도 구매해서 열심히 들어보려고 했는데11월 시험에 다시 응시하고 싶은데 사전에 책을 선공부하고나중에 재요청드려서 남아있는 기간만이라도 재수강하고 싶습니다.꼭 갖고 싶었던 자격증이라 필기 합격까지 3차례의 시도가 있었기에 더욱 절실합니다.꼭 합격해서 후배나 지인분들에게 홍보 많이 할테니 기회를 주시면 감사하겠습니다.