묻고 답해요
169만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강기간연장 문의드립니다
안녕하세요~~강사님 어렵게 필기시험 합격하고강의를 듣고 실기시험을 보려했으나수술, 프로젝트 출장 등으로 실기시험을 접수만하고 시험장 한번 못가보았습니다필기 2년이되어 이번이 마지막 기회라 마지막 실기 시험을 치고 싶은데 학습완료일이 5월 29일입니다6월 시험까지 연장또는 한달만 추가 신청등 방법이 있는지 확인부탁드립니다 메일주소 pkhjjang99@gmail.com 항상 좋은 강의 고맙습니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 연장 문의
안녕하세요. 현재 강의를 수강 중인 수강생입니다.다름이 아니라 제가 11월 시험을 준비 중인데, 현재 강의 수강기간이 10월에 종료되어 시험 전까지 복습 및 학습을 이어가기 어려운 상황입니다.시험 준비를 위해 강의를 계속 활용하고 싶어 혹시 가능하다면 수강기간을 11월 시험 일정까지 조금만 연장해주실 수 있을지 정중히 부탁드립니다.번거로우시겠지만 검토 부탁드리며, 긍정적으로 고려해주시면 감사하겠습니다. 계정: ydk9476@gmail.com
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
label 인코딩 에러 발생 원인
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요label 인코딩에서 train[cols] 확인하는 과정에서 자꾸 에러가 발생하는데 원인이 뭔지 알 수 있을까요? (12분 18초 입니다)
-
미해결[2026] 비전공자도 한 번에 합격하는 SQLD 올인원
속성 핵집문제 2번
보기 중에 '속성은 하나의 값만 가진다.' 라는 보기가 맞는 보기로 해설이 되어있는데, 바로 직전에 설명하신 다중 값 속성(전화번호, 이메일) 이라는게 있지 않나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
LabelEncoding 시 train data 학습(fit_transform, transform)
작업형2 모의문제 풀이에서for col in cols: le = LabelEncoder() train[col]=le.fit_transform(train[col]) test[col]=le.transform(test[col]) 다음과 같이 코딩을 진행하셨는데,이는 그 후 train을 split해서 학습 시 이미 fit_transfrom이 되어 데이터 누출이 되는 방법 아닌가요?
-
미해결[2026] 비전공자도 한 번에 합격하는 SQLD 올인원
chapter 2 단원정리문제 49번
먼저 유사한 질문이 있었는지 검색해보세요.서로 예의를 지키며 존중하는 문화를 만들어가요.잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.49번 문제 해설에는 david phone에 문자가 포함됐다고 하는데 문제에는 숫자만 있는 것 같습니다.확인 부탁드리겠습니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
로지스틱 회귀분석은 옛날거 밖에 없나요?
로지스틱 회귀분석은 구버전 밖에 없나요?신버전 찾고 있는데 못찾아서 보냅니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
판다스 표 표시
판다스에서 시리즈 만들때 저는 화면처럼 표 형식이 아니라 이런식으로 표시되는데, 해결방법이 있을까요
-
미해결[2026] 비전공자도 한 번에 합격하는 SQLD 올인원
extract 함수 관련 질문
먼저 유사한 질문이 있었는지 검색해보세요.서로 예의를 지키며 존중하는 문화를 만들어가요.잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.TO_CHAR(HIREDATE, 'YYYY')대신EXTRACT (YEAR FROM HIREDATE)이거를 쓰는 이유가 뭘까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
1유형 강의 다 나간 후 어떻게 할까요?
일단 1유형 강의는 다들었고 모의고사 15번까지 풀어봤는데나머지 강의에 없는 16~39까지 다 풀고 2~3유형 갈지아니면 일단 강의 다 듣고 나머지 모의고사를 스스로 풀어보는 쪽이좋은지 살짝 고민되어서 쪽지 드려요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
점수차가 많이 나는데 따로 하신게 있으신가요?
안녕하세요 선생님선생님 인강 보면서 기출을 풀어보면서 시험에 대비하고 있습니다. 근데 기출 5회에서 2유형 선생님의 baseline과 제 baseline 수치가 너무 달라서 이렇게 Q&A를 보냅니다.선생님 baseline(랜포)은 1296이 나오는데 제가 한 baseline(랜포)은 1400대가 나옵니다 혹시 제가 뭘 잘 못한게 있는지 궁금합니다아래는 제가한 코드입니다! #eda print('\n====데이터 크기=====') print(train.shape,test.shape) print('\n====데이터 정보=====') print(train.info()) print('\n====train 결측치=====') print(train.isnull().sum()) print('\n====test 결측치=====') print(test.isnull().sum()) print('\n====카테고리=====') cols=train.select_dtypes(include='O').columns for col in cols: set_train=set(train[col]) set_test=set(test[col]) same=set_train==set_test if same: print(col,'O') else: print(col,'X') print('\n====타겟 기초 =====') print(train['price'].describe()) # 전처리 target=train.pop('price') train=pd.get_dummies(train) test=pd.get_dummies(test) # print(train.shape,test.shape) #검증 from sklearn.model_selection import train_test_split X_tr,X_val,y_tr,y_val=train_test_split(train,target,test_size=0.2,random_state=42) print(X_tr.shape,X_val.shape,y_tr.shape,y_val.shape) # rf from sklearn.ensemble import RandomForestRegressor rf=RandomForestRegressor(random_state=42) rf.fit(X_tr,y_tr) pred=rf.predict(X_val) #학습 from sklearn.metrics import root_mean_squared_error print('===rf===') print(root_mean_squared_error(y_val,pred)) #lg import lightgbm as lgb lg=lgb.LGBMRegressor(random_state=42,verbose=-1) lg.fit(X_tr,y_tr) pred=lg.predict(X_val) print('==lg==') print(root_mean_squared_error(y_val,pred)) #lr from sklearn.linear_model import LinearRegression lr=LinearRegression() lr.fit(X_tr,y_tr) pred=lr.predict(X_val) print('==lr==') print(root_mean_squared_error(y_val,pred)) #결과 pred=lg.predict(test) submit=pd.DataFrame({'pred':pred}) submit.to_csv('result.csv', index=False)
-
미해결Data Engineering Course (1) : 빅데이터 하둡 직접 설치하기
강사님.. 하단 URL에 있었던 코드들 다운 받거나 공유 부탁 드립니다..
파일이 삭제 되었습니다.. 설치 파일하나만 섹션으로 넣어주시면 안될까요..? Download Ubuntu 20.04 LTS and Installation Hadoop 3.x on Ubuntu Standalone Operation(Local mode )
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제 4번에 3)문제 질문
안녕하세요 강사님 정답이views_min=df.iloc[:10]['views'].mindf.iloc[:10, -1]=views_min인데, df=df.iloc[0:10]df['views']=df['views'].min()이렇게 쓰면 안될까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이상치 전처리 작업
안녕하세요 강사님다름아니라 2과목 중 데이터 전처리에서 이상치 관련 질문있습니다.제가 강의를 듣었을 때는 이상치를 데이터의 현실적 한계성으로 판단하신거로 이해하였습니다.ex( age 컬럼은 음수가 될 수 없다.)제가 예전에 학교에서는 이상치를 quantile을 통해 IQR값을 추출하고 그 추출한 값을 바탕으로 이상치를 판단했었던 기억이 있습니다. 그렇기에 빅데이터분석기사에서 이상치 값을 판단할 때, IQR로 이상치를 판단 또한 하는게 맞을까요? 아니면 이 과정까지는 필요가 없을까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가결과값 문의
초반에 target(output)을 pop을 이용해 분류하고 검증데이터 분할, 모델 생성/학습을 진행했습니다. roc-auc, f1score, accuracy 평가결과가 1.0 으로 나오는 이유는 뭘까요....? # 타켓설정 target = train.pop('output') # 검증데이터분할 from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size = 0.15, random_state = 0) from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state = 0) rf.fit(X_tr, y_tr) pred = rf.predict(X_val) pred_proba = rf.predict_proba(X_val) from sklearn.metrics import roc_auc_score, f1_score, accuracy_score print(roc_auc_score(y_val, pred_proba[:, 1])) print(f1_score(y_val, pred)) print(accuracy_score(y_val, pred)) ----------------------------------- 1.0 1.0 1.0
-
미해결Data Engineering Course (1) : 빅데이터 하둡 직접 설치하기
하단 파일이 열리지 않습니다
Download Ubuntu 20.04 LTS and Installation Hadoop 3.x on Ubuntu Standalone Operation(Local mode)
-
미해결Data Engineering Course (1) : 빅데이터 하둡 직접 설치하기
ssh-keygen -t rsa -P "" 등 ssh 암호화? 는 하둡에서 필수인가요?
강사님 안녕하세요 아래부터 자세한 설명 없이 코드를 쳤는데 하둡 셋업할때 필수로 입력 해야 하는건가요? export PDSH_RCMD_TYPE=ssh ssh-keygen -t rsa -P "" cat ~/.ssh/id_rsa.pub>>~/.ssh/authorized_keys
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시계열 데이터 날짜와 시간 format
강사님, 안녕하세요.해당 강의에서는 시간 format 파라미터 사용시H만 대문자로 사용하면 된다고 하셨는데,e-book에서는 H:M:S 다 대문자로 되어야한다고 적혀있어서요. 어떤게 맞을까요???
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가지표 F1 스코어 질문드립니다.
안녕하세요!F1 스코어 설명하시면서average = micro, macro, weighted중에 문제에서 요구하는데로 쓰면 된다고 하셨는데..만약 문제에서 제시된 평가지표가 F1 스코어가 아니지만 F1 스코어를 사용하려고 할 경우(문제에서 요구된게 없는 경우)에는 micro, macro, weighted 중 어떤걸 사용하면 될까요?감사합니다.
-
미해결데이터분석에 ChatGPT 강림
수업 내 사용되는 프롬프트 등 강의 자료
현재 '6. 데이터 분석 프로세스 - 데이터의 이해'를 학습 중인데,매 차시에서 프롬프트 작성하시는 화면이 크게 제공되는 것도 있고 아닌것도 있어서, 어떤 질문을 하셨는지 확인해서 따라해 보기가 어렵습니다.통계에 대해 평균, 중간값 정도의 이해만 있는 상태에서 깨져 나오는 화면의 글자를 보고 따라 하기가 너무 어렵네요어떤 차시는 질문 타이핑 하신 걸 확대 해주셔서 보고 했는데, 이번 차시부터는 확대를 안 해주셔셔..뭉그러진 화면을 보고 추측해서 학습을 하고 있습니다.(따라 하고)좀더 데이터 분석에 대해 알면 프롬프트를 따라 하지 않고, 말만 듣고도 내가 질문을 적당히 만들어 할 수있지만, 이제 시작하는 저로서는 무척 어렵네요강의 내 사용하신 프롬프트라도 따로 텍스트로 제공해 주시면 좋겠어요