묻고 답해요
164만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수치형 데이터, 범주형 데이터 분리 기준
안녕하세요,수치형 데이터, 범주형 데이터 분리해서 스케일링 및 인코딩을 하셨는데요!수치형 데이터, 범주형 데이터 분리를 할때와 안할때의 차이가 무엇이고, 기준이 무엇일까요? 다시 말씀드리면, 수치형 데이터, 범주형 데이터 분리를 할때와 안할때의 장단점이 궁금하고,어떤 상황에서 분리를 해야하고, 어떤 상황에서 분리를 하지 않아도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 범주형 인코딩 관련 문의
안녕하세요, 작업형 2 모의문제 푸는 도중 궁금한게 있어 질문드립니다. 범주형 변수(object) 중 drop을 하는 경우가 있고 안하는 경우가 있는것 같은데, 어느정도를 기준으로 잡아야 할지 궁금합니다예를 들어 한개의 컬럼 값이 90개여서 원핫인코딩 시 컬럼이 100개가 넘어가는 상황이 발생하더라구요.이런 경우에 drop을 하는게 도움이 될지, 아니면 drop하지 않고 모든 범주형 변수를 인코딩할지 구분이 어렵습니다.
-
해결됨실전도커: 도커로 나만의 딥러닝 클라우드 컴퓨터 만들기
Virtual Machine 생성시 가격문의
472.31/month 라는 가격이 한달 내내 해당 virtual machine을 사용한다고 가정했을때 과금 되는 가격이라고 이해하면 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제2 질문입니다.
r2 score에 경의 테스트가거의 0.3이하로만 계속 출력되는것으로 강의에서 확인되는데제가 알기로 0.3이하면 굉장히 낮은수준의 모델로 알고있습니다.시험장에서 0.3이하가 나오더라도 제출하는데 문제없을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
csv 파일 만들 때 인코딩 옵션 필요 여부
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요,to_csv로 csv 파일을 만들어서 제출할 때 encoding=‘utf-8’ 옵션을 안넣어도 괜찮을까요?시험문제에서 결과 컬럼명은 항상 영문으로만 출제되나요? (한글로 출제될 때도 인코딩 옵션 따로 안넣어도 되는지 궁금합니다ㅜ)
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1 제출 결과 제출 방법 관련하여
선생님, 작업형 1을 진행하다가 코드로 어떤 방식으로든 문제 풀다가 정답을 알았지만 본 의도대로 코드를 이용해서 print 를 내기가 생각이 안날 때 단순이 그냥 print('정답') 이라는 식으로 print 되게 처리를 하여도 점수를 다 받을 수 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 질문
시험 일주일을 남기고, 벼락치기를 하는 중이라 너무 헷갈려서 질문 남깁니다.어떤 풀이를 보면 수치형데이터만 사용하고, 어떤 풀이를 보면 수치형과 범주형을 각각 train과 test를 나눠서 사용하기도 하고, 또 X_tr,y_tr을 분리해서 사용하는 풀이가 있는 한편 어떤건 그냥 train, test로 사용하기도 하던데 이런것들은 문제에 따라 다르게 사용해야할까요? 아니면 알고있는만큼 작성하는걸까요?
-
해결됨세계 대회 진출자가 알려주는 코딩테스트 A to Z (with Python)
실전 문제풀이 관련 질문
2022 KAKAO TECH INTERNSHIP 문제 중 코딩테스트 공부 문제에서 실패하는 경우가 있어서 왜 그런지 질문드리려고 합니다. 예시풀이 중 dp풀이랑 비슷하게 풀었는데 다른 점은 저는 dp[alg][cop]을 해당 alg, cop에 도달하기 위해 필요한 최소 비용으로 정의하고 마지막에 최대 alg~+30, co~ +30 중 최소값을 리턴하도록 정의했습니다. 이렇게 하니까 정확성은 다 통과하는데 효율성에서 실패하는 경우가 생기던데 왜그럴까요?def solution(alp, cop, problems): answer = 0 problems += [[0,0,1,0,1], [0,0,0,1,1]] dp = [[1000] * 181 for _ in range(181)] dp[alp][cop] = 0 goal = [alp,cop] for alp_req, cop_req, alp_rwd, cop_rwd, cost in problems: goal[0] = max(goal[0], alp_req) goal[1] = max(goal[1], cop_req) for i in range(alp, 181): for j in range(cop, 181): for alp_req, cop_req, alp_rwd, cop_rwd, cost in problems: if i >= alp_req + alp_rwd and j >= cop_req + cop_rwd: dp[i][j] = min(dp[i][j], dp[i-alp_rwd][j-cop_rwd] + cost) answer = 1000 for row in dp[goal[0]:]: answer = min(answer, min(row[goal[1]:])) return answer
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
7회 기출 작업형1, 문제 1번 질문입니다.
영상 7분쯤3) 과목 점수 스탠다드 스케일 부분에서 df[["score"]]=scaler.fit_transform(df[["score"]]) 과#데이터프레임 강사님이 작성하신df["score"]=scaler.fit_transform(df[["score"]]) #시리즈 와 같은 결과가 뜨는데 왜 그런걸까요...? 보통 df[cols]=scaler.fit_transform(df[cols])썼던거 같아서요.. 그럼 전자가 맞는 표현 아닌가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글
캐글에서 문제를 풀고자하는데 copy&edit 버튼을 눌러도 위의 형식대로 표시가 됩니다! 어떻게 해결하면 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의고사2
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 시험에서 작업형2문제가 결측값이 있는 문제가 나오면 value_counts()를 통해 가장많이 있는값을 찾아서 fillna() 해주려합니다. train['name'].value_counts() #Hillside Hoteltrain['name'] = train['name'].fillna('Hillside Hotel')test['name'].value_counts() #Brooklyn Apartment test['name'] =test['name'].fillna('Brooklyn Apartment')그런데 train과 test의 value_counts()값이 달라서 train과 test에 다른값(Hillside Hotel 와 Brooklyn Apartment) 을 넣어도 되나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
xgb warning
시험환경에서 XGB는 warning이 뜨는게 맞는거죠?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출4회-시험환경(캐글)
캐글에 시험환경으로 풀어보기로 풀어보려하는데 shift+enter로 실행이 원래 안되는걸까요? 그리고 df.head()를 해도 아래 출력이 안됩니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
소수점 버림, 올림, 부분 문자 일치 질문입니다.
기출유형 4회 작업형 1 관련 1번 문제소수점을 버려 정수형으로 표현을 할 때 소수점을 버리거나 올리는 함수(예 : round)와 같은 함수가 있나요? 마지막답인 경우엔 int로 쓰면 될 것은데 혹시나 목록에 있는 데이터를 수정할 때 쓸수 있는 방법이 궁금합니다.3번 문제 United Kingdom 단독을 찾으라고 하였는데 문제에서는 United Kingdom 만 나와 있는데 country가 만일 United Kingdom & Korea와 같이 공동 제작이 섞여 있다면 조건을 어떻게 주어야 하나요? 일치하는 문자(==가 아니라 일부 일치하는 것 찾는 조건)
-
미해결RAG 마스터: 기초부터 고급기법까지 (feat. LangChain)
langchain 적용 서비스 배포/운영
안녕하세요 양질의 강의 감사히 잘 듣고 있습니다.다름이 아니라 이렇게 langchain으로 RAG 를 접목시킨 서비스를 배포/운영 하는데에는 어떤 걸 더 배워야하는지 궁금합니다. 지금 생각으로는 1) langchain 소스코드로 gradio나 streamlit 챗봇을 만들고2) 도커 이미지 같은걸 만들어서3) AWS 서버에 배포 (혹은 서버리스) 혹시 제가 생각하는 과정이 맞는지, 아니면 현업에서는 다른 방법을 사용하는지 궁금합니다.이번 강의를 듣고 만든 서비스 배포를 위해서는 어떤 기술을 더 익혀야하는지 알려주시면 감사하겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경 코드 실행 방법
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요시험환경에서 실행 버튼을 눌러야 코딩이 실행되나요? Colab, 쥬피터 노트북에서 shift+ enter로 코드를 실행했었는데 시험환경에서는 실행이 되지 않네요. 시험 환경에서 코드 실행 방법이 불편해서 혹시 다른 방식이 있나 여쭤봅니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
fit_transform 관련 질문
from sklearn.preprocessing import MinMaxScaler mms = MinMaxScaler() df['co'] = mms.fit_transform(df[['co']])MinMaxScaler에서 fit_transform에 [] 를 두번 쓰는 이유가 무엇인가요?강의에서는 문법이라 외워야되는 것처럼 이야기하셨는데 그냥 문법 만든 사람이 저렇게 쓰도록 해서 그런 건가요?시험에 쓰는 함수 중에 저런 특이한 것들이 더 있나요? [], (), [[]] 쓰는 게 헷갈리는데 쉽게 외울 수 있는 기준이나 공식이 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
최종모델 확률값 소수점 범위 다른 경우
최종 모델의 확률 값의 소수점 자리수가 다른경우는 어떻게 해야할까요..?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
최종 모델 선택 후, 같은 조건으로 validation까지 학습해도 되나요?
안녕하세요, 강의 듣던 중 궁금한 점이 생겨 질문드립니다 !강의에서 모델링 및 평가를 할 때 보면 순서가피처 엔지니어링여러 회귀/분류 모델 학습 성능 평가위의 세 단계를 반복하며 제일 성능이 좋은 조건과 모델을 선택하는 것으로 이해했습니다. 위의 과정을 통해 성능 좋은 모델과, 피처 엔지니어링 방법을 알았다면, 검증 데이터로 나눈 것을 다시 학습 데이터로 합쳐서 해당 모델과 조건으로 다시 학습 시켜서 제출하는 방법이 가능한가요?더 많은 데이터셋으로 학습하는 것이 좋지 않을까 하여 질문 드렸습니다 !
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1, 3 제출방식
선생님 실제 시험환경에서 제출방식에 대한 질문이 있습니다.7회차부터 답안 제출 방식이 바뀌었다고 들었습니다. 작업형1, 3유형에서 (풀이용) 코드는 따로 제출하지 않고 풀이만 해서 저장하고(답안제출)에서 답만 제출하면 되는건가요?? 그렇다면 실제로 (풀이용) 탭에서 작성한 코드에 대해서는 따로 채점을 하지 않는다는 걸까요? 실제 체험환경과 강의에 올려주신 9회 응시가이드 화면이 달라서 문의드립니다. <응시가이드> <체험환경>