묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경 ver.2025 작업형2 RMSE
안녕하세요. 이번에 올라온 2유형 문제를 풀어보았는데요. <작성한 코드>import pandas as pdtrain = pd.read_csv("data/customer_train.csv")test = pd.read_csv("data/customer_test.csv")# 사용자 코딩pd.set_option('display.max_columns', None)# 전처리target = train.pop('총구매액')train['환불금액'] = train['환불금액'].fillna(0)test['환불금액'] = test['환불금액'].fillna(0)# [선택2] 원핫 인코딩 (카테고리가 다르면 합쳐서 진행 필요함)df = pd.concat([train, test])df = pd.get_dummies(df)# 다시 분리train = df.iloc[:len(train)]test = df.iloc[len(train):]print(train.shape, test.shape)# 검증용 데이터 from sklearn.model_selection import train_test_splitX_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state = 0)print(X_tr.shape, X_val.shape, y_tr.shape, y_val.shape)# 모델 학습 및 평가from sklearn.ensemble import RandomForestRegressormodel = RandomForestRegressor()model.fit(X_tr, y_tr)pred = model.predict(X_val)from sklearn.metrics import root_mean_squared_errorprint("RMSE:",root_mean_squared_error(y_val, pred))# 제출 pred = model.predict(test)submit = pd.DataFrame({'pred': pred})submit.to_csv('result.csv', index=False)print(pd.read_csv('result.csv')) 결측치를 0으로 채우고 train,test 합쳐서 원핫인코딩 후 랜덤포레스트회귀 모델사용 RMSE 평가지표 값이 나왔는데 강사님 수치랑 너무 크게 차이가 나서요. 이렇게 많이 차이 나도 괜찮은건가요? 작을수록 좋은거이긴 하지만 강사님이랑 너무나 다른 값이 나와서 제가 작성한 코드와 화면 출력하여서 틀린부분이 있는지 문의 드립니다.
-
미해결Next + React Query로 SNS 서비스 만들기
Next의 route handler에 대한 질문이 있습니다.
안녕하세요 Next app router 관련해서 질문드립니다.현재 사이드프로젝트에서 route handler를 적극활용하고 있는데요.제가 인프라나 백엔드 관련 지식이 없다보니 좀 헷갈리는게 있습니다. 현재 저희 서비스에서 특정 API는 클라이언트 컴포넌트에서 route handler로 API 호출 -> route handler에서 외부 백엔드 API 호출이런 형태로 사용되고 있는데요, 이때 실제로 route handler 서버가 아래의 사진 중 어느 형태로 운용되는 것인가요? 즉, Next 프로젝트를 배포했을 때 각 유저마다 route handler 서버가 할당되는 것인가요? 아니면 모든 유저의 요청을 오직 하나의 route handler서버에서 대응하는 것인가요? 아니면 이게 배포 환경에 따라 달라지는것인가요?
-
해결됨실전! Django 입문 [최신 5.2 버전]
가상환경 구현시 에러
python 3.11을 설치했었는데.. 본 강의에 따라 어제 python 3.13을 다시 설치했습니다.강의에 따라 가상환경을 구축하기 위하여 첨부와같이 실행했더니 3.11이 구동됩니다.어떻게 해결해야 할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
파라미터 최적화 GridSearchCV
실기에서 GridSearchCV써도 되나요? 'n_estimators': [100, 200], 'max_depth' : [5, 10], 'min_samples_split': [2, 5] 만 설정했는데도 돌아가는데 꽤 오래걸리는 것 같아서요 귀찮아서 바로 refit해서 쓰고 있는데 돌려보고 나서 GridSearchCV는 주석처리하고 나온 파라미터만 써서 돌려야 할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
궁금한 점 있습니다!
# 출력을 원하실 경우 print() 함수 활용# 예시) print(df.head())# getcwd(), chdir() 등 작업 폴더 설정 불필요# 파일 경로 상 내부 드라이브 경로(C: 등) 접근 불가import pandas as pdtrain = pd.read_csv("data/customer_train.csv")test = pd.read_csv("data/customer_test.csv")pd.set_option("display.max_columns", None)train['환불금액'] = train['환불금액'].fillna(0)test['환불금액'] = test['환불금액'].fillna(0)train = train.drop("회원ID", axis = 1)test = test.drop("회원ID", axis = 1)target = train.pop("총구매액")#print(train.describe(include = 'O'))#print(test.describe(include = 'O'))total = pd.concat([train,test])nums = total.select_dtypes(exclude = 'object').columnscols = total.select_dtypes(include = 'object').columnsfrom sklearn.preprocessing import MinMaxScalermx = MinMaxScaler()total[nums] = mx.fit_transform(total[nums])from sklearn.preprocessing import LabelEncoderfor col in cols: le = LabelEncoder() total[col] = le.fit_transform(total[col])train = total.iloc[:3500]test = total.iloc[3500:]from sklearn.model_selection import train_test_splitx_tr, x_val, y_tr, y_val = train_test_split(train,target,test_size = 0.2, random_state = 2022)from sklearn.ensemble import RandomForestRegressormodel = RandomForestRegressor(random_state = 2022, max_depth = 10,n_estimators = 800)model.fit(x_tr,y_tr)pred = model.predict(x_val)#81957423.82110961pred = model.predict(test)re = pd.DataFrame({"pred":pred})re.to_csv("result.csv",index=False)v = pd.read_csv("result.csv")print(v.shape)강사님 안녕하세요 짧은 지식으로 2유형을 혼자 풀어보고 나서 강의를 들었는데 라벨 인코딩은 set 을 활용해서 train 안에 test 데이터가 다 있다면 따로 합치지 않아도 된다는걸 이제야 알았습니다! 혹시 저처럼 합쳐서 라벨인코딩을 진행하게되면 모델 성능에 큰 영향을 미칠까요? 그리고 합치게 된다면 그냥 원핫 인코딩으로 일관되게 쓰면 되는지도 궁금합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
train데이터가 두개 주어졌을때(추가질문)
안녕하세요! concat에 대한 질문글을 달았다가, 대댓글은 알림이 가지 않는거 같아서 추가질문 드립니다 :) 질문: 어차피 train,test 두개 줘도 train에서 타겟값 분리하고 train, test 컬럼수 일치시키고 진행하니까 굳이 합칠 필요는 없을거 같은데 이해한게 맞을까용? 주로 concat을 이용할때는 train-test 컬럼을 다르게 가지고 있을때 전처리를 위해 이용하겠네요..!답변: 넵 분리되어 있다는 것을 인지하고 있다면 하지 않아도 됩니다.다만 y_train에는 타겟값 뿐만 아니라 ID를 포함하고 있어 이 부분은 주의하셔야 해요! SalePrice 컬럼을 선택해야 해서 기존과 코드가 약간씩 달라질 수 있어요! >> y_train에 id/price(타겟) 컬럼이 있다고 치면, 원래 타겟값만 별도로 저장하고 x_train/test만 사용했는데용...x_train id값과 y_train id값을 일치시켜서 합쳐야된다는 말씀이실까요?아니면 분리할때 id값도 같이 저장안되게끔 주의하라는 말씀이실까요?!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 시험 적용 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 안녕하세요. 빅데이터분석기사를 준비하고 있습니다.시간이 얼마 남지 않아 2유형을 할 때 머신러닝 학습 및 평가 부분을 제외하고 바로 머신러닝 학습 후 test 데이터에 적용해서 예측 결과를 제출해도 크게 상관 없을까요?2유형을 랜덤 포레스트 방식 하나만 외워서 시험을 응시할까 하는데 괜찮을까요?
-
해결됨코딩 없이 AI 자동화 전문가가 되는 법, n8n 완벽 가이드
mcp 연결이 안되네요 ㅠ
ngrok 주소 업데이트 된 걸로 바꿔도 실행이 전혀 안되네요..ㅠㅠGPT랑 얘기해봐도 뭐가 문제인지 잘 모르겠요.. 조언 부탁드립니다..! 저장
-
미해결
mcp 연결 문제입니다
ngrok 주소 업데이트 된 걸로 바꿔도 실행이 전혀 안되네요..ㅠㅠGPT랑 얘기해봐도 뭐가 문제인지 잘 모르겠요.. 조언 부탁드립니다..!
-
미해결쿠버네티스 어나더 클래스-Sprint4 (#Promethues #Grafana #Loki #OpenTelemetry)
마지막 해수편 강의 실습편 너무 어렵네요 ㅠㅠ
기능 얘기할때는 그래도 얼추 이해하면서 봤는데실습은...왜 저걸 하고 느닺없이 values파일에 에 뭔지도 모르는 presets이 왜나오고 logsCollections이 왜나오고..전혀 감을 못잡겠네요 ㅠㅠ 강사님은 필요시에따라 딱딱 찾아가서 뭔가를 작업하고 그 작업을 위해 가이드를 보고 이 가이드의 기능이나 방법 파악을 하시는데.......아~ 좌절입니다. ㅠㅠ 파일에 이 옵션을 보고 custom파일로 만들때 어떤 설정들을 옮기고...각 하나하나 어떤역할이며.........실습들어오고 정말 하나도 이해가 안되네요 ㅠㅠ우리가 쓰는 이미지는 쿠버네티스 버전이라서 다른 버전의 이미지에서 제공하는 기능은 쓰면 안된다고 하는데 이것도 대체...무슨말인가요? 쿠버네티스를 쓰는데 쿠버네티스가 아닌 다른버전이라뇨?? 아~~ 멘붕입니다.
-
해결됨카카오 코테 6주 합격! 실전 파이썬 코딩테스트
섹션 6 사전문제 3번문제 답안이 틀린것 같아요
1번문제 예시 답안에 답안 코드가 없구요3번문제 답안도 문제 수열 (3, 6, 13, 28, 59, ...)과 안맞는데점화식이 a(n) = a(n-1)*2 + (n-2)가 되야 수열과 맞는데 확인 부탁드려요
-
해결됨코딩 없이 AI 자동화 전문가가 되는 법, n8n 완벽 가이드
Youtube Transcript 에러
안녕하세요, 항상 도와주셔서 먼저 감사드립니다.010-youtube-transcript 에서 발생하는 문제인데요,트리거를 실행하면 아래와 같은 에러가 납니다.스스로 해결하고자 구글링도 해보았는데, 무슨 말인지 잘 모르겠네요.도움 부탁드립니다.
-
해결됨한 번에 끝내는 자바스크립트: 바닐라 자바스크립트로 SPA 개발까지
동물앨범만들기 코드 에러문의드립니다!
동물 앨범 만들기 3차 까지 들어서 라이브 코드를 작성하였지만, 강의 내용에서 나오는 웹 실행화면이 출력되지 않고 있습니다.또한, 강사님의 깃 주소에 있는 코드들을 그대로 실행해도 강의 내용처럼 나오지 않습니다.강사님이 동물 앨범 만들기 2차 때는 1차에서 작성한 각 동물들의 js파일과 html 파일을 삭제하라고 하셨는데, 막상 1차때 작성한 파일들을 삭제하니까 동물 사진이 웹에 출력되지 않아서 다시 기재하였습니다그래서, 강사님의 깃 주소에는 1차와 2차, 3차 코드는 중복되게 작성하면 안되는 건가요?강사님처럼 웹 화면에 출력될려면 3차 코드만 있으면 되는 건가요?왜 3차 코드만으로 강의 내용처럼 출력이 안되는 걸까요?1차, 2차, 3차의 모든 코드들을 융합해서 작성해야하나요?다음 강의 node.js와 express.js를 진행할 수 가 없어서 급하게 문의드립니다! !
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제3번 equal_var
예시문제가 제 예상보다 너무 어렵게 나온거같아서 지금 혼란스럽습니다. 학습하지 않은 내용이 나왔네요3번에서 equal_var=True는 생략해도 가능하죠?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 범주형변수 처리시
작업형 3에서 범주형변수 처리시 어떤경우에는 C()처리하고 어떤경우에는 하지말고...헷갈려요강의들을때 독립변수는 그냥 다 C()처리해서 하는것도 좋다고 하셨던거같은데 정리 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
가설검정의 독립표본검정
안녕하세요카이제곱의 독립성검정과 가설검정의 독립표본검정이 문제로만 봐서는 헷갈리는데 시험에서는 지문에 어떤 검정방법을 쓰라고알려주나요? 작업형3은 문제 지문을 보고 어떤 검정방법을 써야하는지 너무 헷갈리네요ㅠ
-
해결됨6주 완성! 백엔드 이력서 차별화 전략 4가지 - 똑같은 이력서 속에서 돋보이는 법
@Async 여부의 차이가 궁금합니다.
@Async @TransactionalEventListener(phase = TransactionPhase.AFTER_COMMIT) public void handleEventJoinCompleted(EventJoinCompletedEvent event) { try { kakaoTalkMessageApi.sendEventJoinMessage( event.getPhoneNumber(), event.getEventName() ); } catch (Exception e) { log.error("알림 발송 실패. eventId={}, eventName={}", event.getEventId(), event.getEventName(), e); } }이 로직은 비동기적으로 이벤트를 처리하는 알림서비스 로직입니다. @TransactionalEventListner(Aftercommit)를 사용하면 메인 로직이 commit 된 이후에 해당 이벤트가 실행하는 걸로 알고있는데@Asnyc를 붙히지 않았더라도 메인 로직에서 끝마치고 해당 이벤트를 실행하니깐 똑같은 결과가 나오지 않나요?차이가 궁금합니다!
-
미해결Airflow 마스터 클래스
Airflow 3.* 버전 수강생 Chapter 18 수강
안녕하세요, 좋은 강의 잘 수강하고 있습니다.다름이 아니라 현재 시점으로 airflow 3.* 버전으로 수강 중에 있는데 Chapter 18을 건너뛰고 Chapter 19를 들으면 되는건지 궁금해서 질문 남깁니다. 답변 미리 감사드립니다.
-
해결됨디지털포렌식 입문자를 위한 디지털포렌식 전문가 2급 실기 시험대비 강의(Encase/Autopsy)
보고서 정리
안녕하세요. 보고서 정리 시 어느정도 까지 정리를 해야되는지 잘 모르겠습니다. 간단한 단답형으로도 답안 작성이 가능한 문제(ex. 운영체제 설치일을 구하라, 복구한 파티션의 총 섹터수, 전체 용량등등을 구하라.)같은 경우에도 찾는 과정등을 설명하면서 답안을 작성하는 게 좋을까요? 강사님의 보고서에는 표와 사진으로 작성하였는데,보통 문제들이 "기술하라"라는 단어로 끝맺음을 해서 서술형으로 적어야 하나 라는 생각이 들었습니다. 파티션 정보나, 볼륨 정보에 대해서 정답에 대한 사진을 첨부할 때, Hex값 없이 FTK Imager에 정리된 내용(Properties)만 첨부해도 괜찮을까요? 혐의에 대한 증거파일을 찾았는데, 그 파일이 스테가노그래피인 경우에는 내부에 숨겨진 파일도 증거목록에 넣어야 하나요?(ex. 답안 제출 시 문제 1번이 스테가노그래피에 관련된 질문사항인 경우, 문제1번 폴더에 답안인 한글 파일, 기존 스테가노그래피 파일을 넣고 추출한 파일도 같이 넣어야 하나요? 아니면 증거원본에 있던 파일만 답안폴더에 넣는 것이 맞나요?) 양질의 강의를 올려주셔서 시험 준비를 잘 하고 있습니다. 감사합니다.
-
미해결(UPDATED) Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
6장 Keras로 MF 구현하기 학습 결과
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 6장.ipynb 받은 파일에 있는 소스코드로 학습 진행 후, 시각화를 해보는데 결과가 너무 안 좋게 나옵니다...(위 2회 실행 결과)6장.ipynb에 따로 코드를 수정하지는 않았고 강의 영상 보면서 순서대로 실행만 시켜본 상태인데.. (추가) 바로 밑에 딥러닝을 적용한 추천시스템 학습에 대한 결과 그래프도 안좋아요.(추가)딥러닝에 변수 추가하기 어디 잘못된거나, 사전에 뭔가 따로 처리해줘야 하는게 있나요?