묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨초보 기획자/PM을 위한 Test Case 작성 및 QA 노하우
테스트 케이스는
안녕하세요 처음 qa를 진행하는데 테스트 케이스를 제가(pm) 작성하고 qa 진행할 때보통 qa진행하는 분들께 전부 테스트 케이스를 공유해서 같이 확인하나요? 아니면 저(pm)만 확인하는 편인가요?
-
미해결
4회 기출 유형(작업형2)
왜 저는 원핫인코딩할떄 bool로나오죠? 이번 한번이 아니라 전에도 강의에서는 int로 나오던데 왜 저만 bool로나오는지 이해가안가더라구요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모의고사 오류
어제까지 모의고사를 잘 풀고 있었으나,오늘 새벽부터 갑자기 이러한 오류가 발생하고 있습니다. 원인과 해결법을 알 수 있을까요?
-
해결됨<머신러닝, 핵심만 빠르게!> 완독 챌린지
온라인 강의 관련 문의
안녕하세요.온라인 강의를 듣기 위해서 별도로 쿠폰을 등록해야하는지 몰랐습니다.기한이 만료되어 현재 받을 수 없다고 알림이 뜹니다.혹시 다시 받을 수 있을까요? ㅠㅠ메일은 dong2857210@gmail.com입니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실제 문제에서 평가지표를 다 외워야할까요?
평가 지표 외우기가 힘든데 R-Squared만 외워도 합격하는데 문제가 없을까요?학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1모의문제2문제4
여기서 .columns를 안 붙여도 삭제가 되는데 붙이는 이유가 있을까요? 안 붙여도 되나요?
-
해결됨[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
답변 항상 감사드립니다. 질문 있습니다.
5회 작업형 2문제 입니다. 질문이 좀 됩니다.import pandas as pd import numpy as np X_test = pd.read_csv("X_test.csv") X_train = pd.read_csv("X_train.csv") y_train = pd.read_csv("y_train.csv") #-------------전처리-------------- xtrain = X_train.drop(columns = 'device_id') xtest = X_test.drop(columns = 'device_id') cond = y_train['repair_cost'] <= 0 ytrain = y_train[~cond] #-------------스케일링-------------- from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler() xtrain1 = scaler.fit_transform(xtrain) xtest1 = scaler.fit_transform(xtest) #-------------모델링-------------- from sklearn.ensemble import RandomForestRegressor model = RandomForestRegressor() model.fit(xtrain1, y_train) pred = model.predict(xtest1) #-------------검증-------------- yhat = model.predict(xtrain1) a = np.corrcoef(yhat, y_train.values.flatten()) print(a)[질문]모델링 관련 질문입니다.저는 전처리 단계에서 ytrain 'repair cost'가음수이거나 0인 값은 빼는 것이 맞다고 판단하여 drop하였습니다.repair cost가 공짜일 순 있으나 음수인것은 말이 안되니까요.학부생일때도 결측값이나 해석하기 애매한 값에 대해서는mean이나 mode로 채우지 않고다 drop 했었는데, 빅분기 2유형에서도 이런 전략이 유효한가 여쭙는 질문입니다.(xtest 테이블에 있는 행들은 하나라도 drop하면 안되는 것으로 알고 있긴합니다.)(예를 들어, 주어진 xtrain '나라' 열에 '미국, 영국, 프랑스' 라는 3가지 값이 있고xtest '나라'열에 '독일, 러시아, 영국'라는 3가지 값이 있으면,원핫인코딩으로 전처리하고 모델돌릴시 에러가 뜨지않습니까?이런 에러 방지를 위해서라도 drop이 편한다고 생각합니다.)모델링 관련 질문입니다.2유형은 분류, 회귀 중 한 문제가 통으로 나온다고 알고 있습니다.찾아보니 LightGBM등 머신러닝 기법 종류는 다양한데,랜덤포레스트 Classifier와 Regressor로 2유형은 정리 가능한지 문의드립니다.당연히 장담은 못 주시겠지만,코딩 대한민국님 기출 강의 먼저 듣고시중에 나와있는 연습문제 풀다보니막히는 곳이 많아서 걱정입니다.(주로 전처리에서 막힙니다. 시중 연습문제들은 기출문제들 같이 데이터 전처리가 간단하지 않네요.)코딩 관련 질문입니다.특히 스케일링시,저는scaler = MinMaxScaler() xtrain1 = scaler.fit_transform(xtrain) xtest1 = scaler.fit_transform(xtest)이렇게 했는데,코딩대한민국님 강의에서는 scaler = MinMaxScaler()scaler.fit(xtrain)xtrain1 = scaler.transform(xtrain)xtest1 = scaler.transform(xtest)이런식으로 하시더라구요.비교해보니 출력값은 같아 보이는데, 차이점이 무엇인지 여쭙습니다.fit은 xtrain만 했는데transform은 xtrain뿐만 아니라, xtest도 알아서 되는 메커니즘이 이해가 안가네요.transform은 fit이 사전에 수행 안되도 되는 것일까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
9회 기출 작업형3 문제 1-3
강의시간 16:46 따로 test["design"]에 안넣고 변수로 지정하여서 예측을 진행한 후 rmse계산을 하였는데 결과가 다르게 나온 이유가 무엇일까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
앞서서 잘못저장된거 어떻게 취소하나요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 안녕하세요df['출동시간'] = pd.to_datetime(df['출동시간']) df['도착시간'] = pd.to_datetime(df['도착시간']) df.info() 이렇게 했어야했는데 실수로 df['출동시간'] = pd.to_datetime(df['출동시간']) df['도착'] = pd.to_datetime(df['도착시간']) df.info() 이라고해서 0 소방서 100 non-null object 1 출동시간 100 non-null datetime64[ns] 2 도착시간 100 non-null datetime64[ns] 3 도착 100 non-null datetime64[ns] 이라고 나옵니다 실수로 도착이라고 저장된거를 어떻게 취소하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험 답안 제출 시 질문입니다.
지금 기출 6회 작업형 1-1번 문제를 풀던 중 갑자기 의문이 생겼습니다. result = df.gruopby('소방서')['diff'].mean()에서 나온 결과물에서 바로 수치를 확인하고 답안을 제출해도 되는지?? 꼭 print(81)로 코드가 입력하여 결과물이 나온 상태로 확인하고 답안을 제출 해야하나요?
-
미해결[Rookiss 라이브 세미나] AI 시대를 살아가는 게임 개발자의 생존 전략
AI 시대의 새로운 기회..
안녕하세요. 저는 컴퓨터학과를 재학중인 대학교 2학년 학생입니다. (제 상황을 이해하시는 데에 도움이 될 듯해 먼저 적습니다)"로봇이라거나 AI라거나 하는 신기술을 가지고 새로운 시도를 빠르게 하는 것이 굉장히 큰 기회이다"..로 받아들였는데요, 매우 동의되는 의견입니다만.. 한 가지 고민이 생겨 질문드립니다. 인터넷뿐만 아니라 현실에 적용되는 이야기를 하시는 것이라고 생각합니다. 현재는 쇼츠 찍어내는 간단한 정도에 그치지만, 기술이 조금 더 고도화된다면 상상 가능한 모든 분야에 적용되겠죠. 어떤 것이 먼저 발전하냐에 따라서 적용되는 분야의 순서는 다르겠지만요.. 저는 대학 입학 전(약 2년 전 즈음) ai 시대에 과도기가 올 것이라고 생각했고, 그 과도기에 게임을 1인 내지 소규모 집단에서 괜찮은 퀄리티로 "찍어낼 수 있다면" 아주 좋은 기회가 될 수 있겠다는 이유와 게임에 대한 경험이 있다는 이유로 게임 개발을 진로로 정했었는데요, 그래서 괜찮은 대학 컴퓨터학과에 입학했습니다. (중요한 것이 정말 전혀 아닌것은 알고 있습니다만, 한국 상위 5개 대학 내의 학교입니다.) 그러나 사실 저는 대학 입학 전 코딩을 해본 적이 없었습니다. 그리고 게임 개발은 어렵습니다. 2년이 지난 지금, 여전히 "찍어낼" 수준에 도달하지 못했습니다. 그 수준이란 최근에 출시된 "escape from duckov" 개발진들의 수준 정도로 볼 수 있을 것 같아요. 게임을 제작한 팀의 총 인원 수가 5명이더군요. (개인적으로 그 게임의 성취는 ai의 발전과 관련이 있다고 생각합니다.) 포기하지 않고 그 수준에 도달하기 위해 게임쪽에 올인을 해야 할지,아니면 인력수준의 고도화가 필요한 게임 산업의 후발 주자로서 쫒아가는 것을 포기하고 현실에서 아이템(사실상 게임개발의 범위를 벗어난, 사업가에 가까워지네요.)을 찾는 것에도 신경써야 할지 고민입니다. 전자를 택한다면 후자를 신경쓸 겨를이 없기에 그 기회와는 멀어질 것이고, 후자를 택한다면 고도로 숙련되어야 하는 게임분야에서의 성공은 멀어지겠죠. 전자를 택한다면 루키스님의 여러 강의에서의 의견을 생각할 때에 [학원을 가는 것 + 학원에 가서 엔진도 따로 계속 쓰며 무언가 만드는 것]이 좋을듯했습니다. "찍어낼" 정도를 바라본다고 해서 이미 실력이 쌓였을 거라고 생각하실 수도 있겠으나 아니 사실 그것보다도 더, 꽤 못합니다. 정확히는 c++에는 손도 안 댄 채 c#, 유니티부터 시작해 기본기가 없다고 볼 수 있겠습니다. 유니티로 뱀서정도는 구조를 생각하며 충분히 만들 수 있으나 그 이상부터는 힘들어지는 수준이라고 생각하시면 될 거 같습니다. 유니티엔진이 내부적으로 작동하는 그래픽스적 원리와 인사이트는 당연히 처참한 수준입니다. (컴퓨터그래픽스 수업을 듣긴 했으나 학교 수업은 전반적인 내용을 훑는 것에 가깝다고 생각합니다. 실질적으로 도움이 될 정도의 시간투자는 따로 해야한다고 느껴졌습니다)엔진 딸깍에 해당하는 공부를 열심히 한 셈이죠.이 선택지가 끌리는 이유가 있다면, 한 가지라도 무엇이든 제대로 해야 다른 일도 잘할 수 있을 것 같다는 생각을 가지고 있기 때문입니다. 후자를 택한다면 하나 걸리는 점은, 애초에 뭘 하든 진입자 입장에서는 숙련에 쉬운 일이 없다는 점입니다.(극단적인 비숙련 노동직이 아닌 이상) 그리고 뭘 하든 시장에 먼저 진입한 사람은 존재한다는 점입니다.예시로 라멘 식당 사업을 자동화해서 한다고 쳐도, 신규 진입자 입장에서는 자동화를 어떻게 할까하는것보다 원래 식당 운영에 중요한 것(원래 해당 도메인에서 중요한 지식)이 애초에 선행되어야 한다고 느껴집니다. 이미 식당업에서 몇년 굴렀고, 프랜차이즈화하고자 하는 아이템이 있다면 전과는 비교도 안될정도로 큰 성공을 거둘 가능성이 열릴 수 있겠으나 그렇지 않다면 식당에서 면 삶는 법부터 배워야 할 테니까요.(애초에 그 제품과 프로세스에 대한 이해가 필요하다는 것에 관한 비유입니다) 그렇다면 필연적으로 그 시장을 잡고 있던 이들이 움직이는 것보다 늦을 테고, 시행착오도 그때에 반복될테니 효율도 낮을 것이고요.그러나 한편으로는 제가 경험해보지 않은 터라, 실제로는 그렇지 않을 수도 있으려나 하는 생각도 듭니다. 아니면 애초에 둘 중 하나를 선택하는 게 아니라, 둘 다 상황을 봐서 뛰어드는 것일까요? (ex. 이미 하고있던 게임쪽은 계속 파되, 휴머노이드 등 굵직하고 혁신적인 기술이 상용화될 조짐이 보이기 시작한 훗날에 그 분야에서 가능한 것 탐색..)-> 여기서 걸리는 점은 애초에 그런 생각과 논리를 가지고 있다면 지금 게임개발에 열중하는게 아니라 llm으로 가능한건 다 시도해봐야 하는.. 본업으로 삼은 것에 소홀해지는 딜레마가 또 있는 것 같네요. 루키스님은 제 상황이라면 어떻게 하는 게 좋다고 생각하시나요?그리고 루키스님은 위 관점에서 어떻게 살고 계시나요? ("한 가지에 올인 or 가능성 탐색" 이라고 요약할 수 있을 듯합니다)이 질문이 너무 "제 미래를 정해주세요"처럼 들려 부정적으로 보이신다면, 그냥 루키스님의 개인적인 생각을 적어주셔도 좋을 것 같습니다. 질문이 정말 기네요. 너무 죄송스러울 따름입니다..
-
미해결
강의메일이 오지 않았습니다.
안녕하세요!챌린지 신청 후 강의쿠폰 메일발송 후 등록기한 1일이라 그래서 매일 메일함을 확인하였는데 저는 강의메일이 오지않아 완독챌린지라 정말 책만 봐야하는 것인줄 알았고 책만 며칠째 보고있었는데요. 질문글을 보니 강의메일이 왔었다고 하는데전 등록한 메일함 전체, 스팸함 어디에도 안왔습니다.제가 신청한 것은 강의가 없는게 맞는건가요? 아님 전 메일이 누락된건가요...? 혹시 누락이라면 재발송 혹은 따로 등록이 가능할까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 문제2
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 저는 파이썬 왕초보인점 먼저 밝힙니다 ㅜ df.loc[2000].mean() 을 실행했을 때 왜 저는 선생님처럼 안나오고 np.float64(100.735) 이렇게 나올까요? 똑같은 코드를 썻는데요 ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제1번 '상위' 오해 소지는 없을까요?
문제 1번에서 상위 10개 데이터라고 하는데, 언젠가 풀어본 문제에서 "상위 10개"가 값이 큰 순서대로 상위 10개가 아니라, 그냥 주어진 데이터에서 상위 10개를 뽑는 경우가 있었어서 처음에 풀 때 그냥 주어진 값에서 index 0~9까지를 추출했습니다. 근데 풀이내용을 보니, 내림 차순 후 진행하시더라구요...혹시 실제 문제에서 이런 오해의 소지가 있을만한 건 없을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
필수 인강 리스트
안녕하세요. 현재 커리큘럼에따라 2과목까지는 다 들었는데 시험일정이 촉박하여 모든 인강을 듣고, 실습 연습까지 할 수 는 없을거 같은데필수 인강 리스트와 필수 문제리스트를 추천해주실 수 있으실까요?데이터분석을 대학교때 어느정도해서 기초는 있는 상황입니다.
-
미해결죽음의 Spring Batch: 새벽 3시의 처절한 공포는 이제 끝이다.
ExitCode 질문
킬구형 5장. 작전2: Run Squad 장악 작전 공부중인데, Process finished with exit code 0이라는 문구 자체가 나오질 않아. 혹시나 싶어서 새 프로젝트 만들어서 시도해봐도 마찬가지고,, 윈도우 11, java 17에 org.springframework.boot:spring-boot-starter-batch:3.5.7 환경에서 개발중인데 혹시 버전이나 OS 문제일까?? 아니면 뭔가 설정을 빼먹은건지 모르겠네.. 혹시 몰라서 application.yaml 설정도 첨부해spring: application.name: demo output.ansi.enabled: always datasource: url: jdbc:h2:mem:test;DB_CLOSE_DELAY=-1 driver-class-name: org.h2.Driver username: sa password:
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
proba와 문자형
proba 사용 시에 [:,1]을 사용하는건 문제마다 다른건가요? 정확히 어떤 문제에 [:,1]을 사용하는지 예시와 함께 알고 싶습니다. 또한f1score에서 pos_lable="A"라고 말씀해주셨는데 이 부분도 정확히 이해가 안갑니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험 볼때 코랩처럼 약간 정보제공이 되는건가요?
이런식으로 코딩 하다보면 밑에 정보가 나와서 도움이 되는데, 시험환경에선 저런게 없다고 보면되죠??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모델 선택
강의를 해주시면서XGBoostRandomForesetLGBM위 모델에 대한 설명이 주를 이루고 있는데 해당 모델은 모두 분류,회귀 모두 사용 가능한걸로 알고 있습니다. (제가 이해한 게 맞나요?) 다른 모델들도 포함해서 시험장에 총 2개의 모델로만 활용을 하고싶은데 어떤 모델을 추천하시는지 궁금합니다.
-
미해결
온라인 강의 등록
기한을 놓쳐 쿠폰을 등록하지 못했습니다. duddk@bsis.hs.kr입니다. 등록 부탁드립니다.