Thumbnail
BEST
데이터 사이언스 자격증 (데이터 사이언스)

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3) 대시보드

(5)
102개의 수강평 ∙  1,362명의 수강생
99,000원

월 19,800원

5개월 할부 시
지식공유자: 퇴근후딴짓
총 70개 수업 (17시간 57분)
수강기한: 
12개월
수료증: 발급
난이도: 
입문
-
초급
-
중급이상
지식공유자 답변이 제공되는 강의입니다
폴더에 추가 공유
퇴근후딴짓 프로필
D-4, 추가 영상을 업로드 했어요!
퇴근후딴짓 5달 전 (5달 전 수정됨)

추가 영상을 업로드 했어요!

  • dir과 help 완벽 마스터

  • 인코딩 방법 정리

  • csv

  • 시험응시전략

등 시험 전에 정리에 도움이 되었으면 합니다.

시험 잘 응시하고 꼭 합격하셔서 후기 기대하겠습니다 🥳

 

image

(위 영상은 임시로 끝에 두었으며 추후 정리될 예정입니다)

퇴근후딴짓 프로필
작업형2가 매우 중요한 것 아시죠? 반드시 40점 획득해야 합니다💪
퇴근후딴짓 5달 전 (5달 전 수정됨)

7회를 준비하기 연습하기 좋은 대회(데이터)가 있어 공유해요
화이팅입니다. 👏👏👏

회귀

 

분류

 

시험과의 차이점은 아래 대회는 csv생성시 test_id값과 예측값을 함께 만들어야 하고
시험은 예측값만 csv로 만들면 됩니다.

다른 댓글 보기(1)
퇴근후딴짓 프로필
🍦 공식 예시문제 작업형2 강의 update
퇴근후딴짓 5달 전 (5달 전 수정됨)

공식 예비문제 작업형2 강의를 업데잇 햇어요! 시험 전에 꼭 살펴보세요!

  1. 3개의 데이터가 아닌 2개의 데이터로 제공

  2. roc-auc 평가 지표만 있을 뿐 확률로 제출하란 말이 없음

  3. 카테고리가 많아 눈으로 비교 불가능할 때 비교 방법

  4. train_test_split없이 제출도 가능

  5. 레이블 인코딩

등을 다루고 있어요!!

 

반드시 해야 하는 것

  • 결측치 처리

  • 인코딩 (레이블 또는 원핫 중 택1)

 

해도 되고 어려우면 안 해도 되는것

  • train_test_split

  • 스케일링

     

다른 댓글 보기(2)
퇴근후딴짓 프로필
🔥7회 준비 스터디(오징어게임) 방 오픈🔥(마감)
퇴근후딴짓 5달 전 (5달 전 수정됨)

한 달간 대화하면서 함께 공부하고자 디스코드에 공간을 만들었습니다.🙌

닉네임 + 간단 미션을 수행하면 입장 권한이 부여됩니다.

Community Based Learning!!
그라운드 룰: 미션을 수행하지 않으면 제거 됩니다.

공지사항을 확인 후 7회 준비 방으로 오셔서 함께 공부해요!!
https://discord.gg/25jF8EaY3F

 

단, 이 곳은 제게 질문하는 곳은 아닙니다.
제게 직접 답을 듣고 싶은 질문은 인프런으로 부탁드려요!!🙏

퇴근후딴짓 프로필
7회 실기 고사장이 공개되었어요!🤗 (10월 30일 접수)
퇴근후딴짓 6달 전 (6달 전 수정됨)

7회 실기 고사장이 공개되었어요!🤗

  1. 미리 고사장 후보 1, 2 선정한다.

  2. 10월 30일(월) 10시 접수 시작과 동시에 접수한다.


여러분들이 원하는 곳에서 시험을 응시했으면 하는 바램입니다.

매 시험마다 고사장이 변경되고 있어 비교는 어렵지만 서울 기준 - 강남역, 신촌역 등 역 주변이 가장 빨리 좌석이 사라졌어요. 시설이 좋다기보다 시험 시작 시간에 늦지 않고 도착하기 좋은 곳입니다 :)

접수 일정 잊지 않도록 미리 알람/캘린더에 등록하길 추천해요!

No.	지역	고사장명	주소	잔여좌석
1	(서울) 서경대학교 북악관	서울 성북구 서경로 124 서경대학교 북악관	322	
2	(서울) 성공회대학교 이천환기념관	서울 구로구 연동로 320 성공회대학교 이천환기념관	108	
3	(서울) 한성대학교 탐구관	서울 성북구 삼선교로16길 116 한성대학교 탐구관	123	
4	(서울) 한양여자대학교 정보문화관	서울 성동구 왕십리로 222 한양여대 정보문화관	423	
5	(서울) 광운인공지능고등학교	서울 노원구 광운로1길 24 광운인공지능고 창조관	102	
6	(서울) 서울디지텍고등학교	서울 용산구 회나무로12길 27 서울디지텍고등학교	114	
7	(서울) 선린인터넷고등학교	서울 용산구 원효로97길 33-4 선린인터넷고 3호관	194	
8	(서울) 선일빅데이터고등학교	서울 은평구 갈현로29길 27 선일빅데이터고등학교	150	
9	(서울) 성동공업고등학교	서울 중구 다산로 290 성동공고 창조관	227	
10	(서울) 구디아카데미	서울 금천구 가산디지털2로 95 구디아카데미(KM타워 3층)	144	
11	(서울) 비트교육센터	서울 서초구 서초대로74길 33 비트교육센터(비트빌)	151	
12	(서울) 서울IT아카데미 홍대	서울 마포구 양화로12길 23 서울IT아카데미 홍대	99	
13	(서울) 아이티윌	서울 강남구 테헤란로 124 아이티윌(삼원타워 4층)	240	
14	(서울) 이젠아카데미 신촌	서울 서대문구 신촌로 141 이젠아카데미 신촌(위고인호스텔)	67	
15	(서울) 중앙정보기술인재개발원 이대ㆍ신촌	서울 마포구 신촌로 176 중앙정보기술인재개발원 이대ㆍ신촌(중앙빌딩)	139	
16	(서울) 중앙정보기술인재개발원 강남	서울 강남구 테헤란로7길 7 중앙정보기술인재개발원 강남(에스코빌 6층)	79	
17	(서울) 한국IT직업전문학교 양재관	서울 서초구 바우뫼로 87 한국IT직업전문학교 양재관	181	
18	(서울) 한국정보교육원	서울 관악구 봉천로 227 한국정보교육원(보라매샤르망 5층)	129	
19	(서울) 휴먼교육센터	서울 영등포구 영중로8길 6 휴먼교육센터(성남빌딩 B동 6층)	80	
20	(경기) 장안대학교 정보통신관	경기 화성시 봉담읍 삼천병마로 1182 장안대학교 정보통신관	356	
21	(경기) 한봄고등학교	경기 수원시 권선구 호매실로 46-93 한봄고등학교	54	
22	(경기) 강림직업전문학교 별관	경기 평택시 원평로84번길 28-22 강림직업전문학교 별관	60	
23	(경기) 그린컴퓨터아카데미 안산	경기 안산시 단원구 중앙대로 921 그린컴퓨터아카데미 안산(동서코아 3층)	103	
24	(경기) 연세IT미래교육원	경기 수원시 장안구 정조로 940-1 연세IT미래교육원	120	
25	(경기) 우리인재개발원	경기 부천시 부천로29번길 7 우리인재개발원	60	
26	(인천) 한국폴리텍II대학 인천캠퍼스 5기술관	인천 부평구 무네미로448번길 56 한국폴리텍II대학 인천캠퍼스 5기술관 2층	64	
27	(인천) 그린컴퓨터아카데미 인천	인천 부평구 부평대로 19-1 그린컴퓨터아카데미 인천(신도시프라자빌딩 9층, 10층)	100	
28	(인천) 다산직업전문학교	인천 미추홀구 주안로 108 다산직업전문학교(경향프라자 9층)	100	
29	(대전) 그린컴퓨터아카데미 대전중앙	대전 중구 대종로 484 그린컴퓨터아카데미 대전중앙(JS그린빌딩 7층)	90	
30	(대전) 미래융합교육원	대전 서구 계룡로491번길 86 미래융합교육원	72	
31	(대전) 비젼직업전문학교	대전 중구 중앙로137번길 27 비젼직업전문학교	75	
32	(대전) 세잔IT직업전문학교	대전 중구 중앙로137번길 36 세잔IT직업전문학교	77	
33	(대전) 우쌤전산세무회계직업전문학교	대전 서구 둔산서로 3 우쌤전산세무회계직업전문학교 (선우빌딩 11층)	66	
34	(대전) 그린컴퓨터아트학원 대전캠퍼스	대전 서구 대덕대로 182 그린컴퓨터아트학원 대전캠퍼스(오라클빌딩)	121	
35	(대구) 경북산업직업전문학교	대구 동구 동부로 121 경북산업직업전문학교	172	
36	(대구) 예담직업전문학교	대구 중구 중앙대로 403 태왕아너스타워 5층 예담직업전문학교	70	
37	(대구) 한국디지털직업전문학교	대구 동구 신암로 128 연곡빌딩 3층 한국디지털직업전문학교	108	
38	(대구) 그린컴퓨터아트학원 대구캠퍼스	대구 중구 중앙대로 394 그린컴퓨터아트학원 대구캠퍼스(제일빌딩)	121	
39	(부산) 그린컴퓨터아카데미 부산서면2별관	부산 부산진구 중앙대로 749 그린컴퓨터아카데미 부산서면2별관(혜도빌딩 4층)	124	
40	(부산) 부산더조은직업전문학교	부산 부산진구 신천대로50번길 79 부산더조은직업전문학교(더조은컴퓨터아카데미 5층)	100	
41	(부산) 부산메인직업학교	부산 사하구 낙동대로 332 부산메인직업학교 (희망빌딩)	80	
42	(부산) 새동아직업전문학교	부산 사하구 하신중앙로 323 전원빌딩 새동아직업전문학교	120	
43	(부산) 센텀직업전문학교	부산 해운대구 센텀중앙로 48 센텀직업전문학교(에이스하이테크21 5층)	75	
44	(광주) 한국폴리텍V대학 광주캠퍼스	광주 북구 하서로 85 한국폴리텍V대학 광주캠퍼스 서석관, 본관	50	
45	(광주) 광주국제직업전문학교	광주 북구 호동로 6-6 광주국제직업전문학교 (전대점)	140	
46	(광주) 그린컴퓨터아트학원 광주첨단	광주 광산구 임방울대로 782 그린컴퓨터아트학원 광주첨단(한아름빌딩 2층)	72	
47	(울산) 울산직업전문학교	울산 남구 삼산로 111 울산직업전문학교(현은빌딩)	120	
48	(강원) 더조은컴퓨터아트학원 춘천	강원 춘천시 경춘로 2362 더조은컴퓨터아트학원 춘천(GU빌딩 8층)	90	
49	(제주) 제원직업전문학교	제주특별자치도 제주시 노연로 119 제원직업전문학교(장주빌딩 3층)	50	


다른 댓글 보기(3)
퇴근후딴짓 프로필
[다중분류] 평가지표 안내
퇴근후딴짓 10달 전 (10달 전 수정됨)

다중분류 평가지표에 대해 안내해요💪💪💪

문제에서 요구하는 대로 평가지표를 사용하면됩니다.

만약 모르겠으면 알고 있는 평가지표를 편법으로나마 활용해주세요:)

F1스코어

  • predict로 예측

  • micro, macro, weighted

from sklearn.metrics import f1_score
f1_score(y_true, y_pred, average='macro')  # micro, macro, weighted

정확도 (이진 분류와 차이가 없음)

  • predict로 예측

from sklearn.metrics import accuracy_score
accuracy_score(y_true, y_pred)

roc-auc

  • predict_proba로 예측 -> 이진분류처럼 pred[:,1] ❌ pred 그대로 👌

  • ovo, ovr

from sklearn.metrics import roc_auc_score
roc_auc_score(y_val, pred, multi_class='ovo')
roc_auc_score(y_val, pred, multi_class='ovr')


 

 

 

 

 

퇴근후딴짓 프로필
인코딩/결측치 처리를 안 해도 되는 방법이 있다고?
퇴근후딴짓 10달 전 (10달 전 수정됨)

🆕 "lightGBM 활용" 영상을 추가했습니다.

  • 범주형 데이터 인코딩 없이

  • 결측치 처리 없이

  • lightGBM은 사용가능합니다. :)

 

🆕 기출 5회 작업형1 영상 추가

  • 코드만 있었는데 설명 영상을 추가했습니다.💪💪💪

퇴근후딴짓 프로필
[작업형2] lightGBM 모델을 소개합니다. (분류/회귀)
퇴근후딴짓 10달 전 (10달 전 수정됨)

작업형2 어떤 모델을 준비해갈 예정이세요?
1. 랜덤포레스트 분류/회귀
2. lightGBM 분류/회귀를 추천합니다.

lightGBM은
XGBoost와 함께 인기 있는 부스팅계열 모델입니다.
학습과 예측 속도가 XGBoost에 비해 빠릅니다.
영상 제작 당시엔 lightGBM을 지원하지 않았지만 지금은 시험환경에서도 사용 가능합니다.

XGBoost가 실행은 잘 되지만 간혹 워닝이 발생하네요. XGBoost대신 lightGBM을 준비하는 것을 추천해요

####### 분류  #######
import lightgbm as lgb
model = lgb.LGBMClassifier()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
# y_pred = model.predict_proba(X_test) #평가기준 roc-auc일 때


####### 회귀  #######
import lightgbm as lgb
model = lgb.LGBMRegressor()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

# 하이퍼파라미터 튜닝은 xgboost(작업형2 모의고사3 강의)과 동일하게 사용하면 됩니다.
# 예: max_depth=5, n_estimators=600, learning_rate=0.01

 

 

다른 댓글 보기(2)
퇴근후딴짓 프로필
[작업형3] 귀무가설을 기준으로 검정의 결과를 (채택/기각) 합니다.
퇴근후딴짓 10달 전 (10달 전 수정됨)

체험하기 - 작업형3 답안 제출 포멧이 공개 되었어요.

작업형3은 귀무가설을 기준으로 검정의 결과를 (채택/기각) 합니다.

image체험하기 링크: https://dataq.goorm.io/exam/116674/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/4

다른 댓글 보기(1)
퇴근후딴짓 프로필
🔅 실기 고사장 안내 (미리 응시할 곳을 생각해주세요)
퇴근후딴짓 11달 전 (11달 전 수정됨)

6회 실기 고사장이 공개되었어요!

  1. 미리 고사장 후보 1, 2 선정한다.

  2. 5월 22일(월) 10시 접수 시작과 동시에 접수한다.

수강 신청 만큼 힘든 건 전혀 아니지만
그래도 여러분들이 원하는 곳에서 시험을 응시했으면 하는 바램입니다.

시험마다 고사장이 변경되고 있어 비교는 어렵지만
예를들면 서울에서는 강남역 옆(10번)과 신촌역 옆(9번)이 가장 빨리 좌석이 사라지지 않을까 싶네요!
시설이 좋다기보다 역 옆이라 시험 시작 시간에 늦지 않고 도착하기 좋은 곳입니다 :)
경기도 지역은 고사장이 없었는데 이번에 수원도 고사장이 생겼네요!!

접수 일정 잊지 않도록 미리 캘린더에 등록하길 추천해요!

image

 

퇴근후딴짓 프로필
6회 준비 스터디 모임 / 오징어게임 (~5.21까지 모집)
퇴근후딴짓 11달 전 (10달 전 수정됨)

빅데이터 분석기사 실기를 혼자 준비하기 어렵다면 함께 공부해요!!
해당 스터디 모임은 인프런 강의와는 별개로 진행하는 모임입니다.
일반적인 스터디와 달리 매일 미션 수행이 없으면 정말로 제거(퇴장)되는 모임임을 기억해주세요 🙌
의지가 약한 분에게 강력 추천해요 :)

📌 모집기간: ~5. 21(일)까지 모집
📌 방식: 디스코드 활용 (매일 미션 제출)
📌 기간: 5월 15일(월) ~ 6월 24일(토)
📌 안내 및 참가: (마감)

혼자가 편하다면
https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr 를 활용해 주세요!
이곳에 있는 내용을 활용해 모임에서 매일매일 풀어나갈 예정이에요!

[주의] 디스코드에서는 제게 질문을 해도 답을 드리진 않습니다. 수험생 간 질문과 답변을 하고 있어요 ~
제게 답변을 듣고 싶다면 인프런을 활용해주세요🙇🏼‍♂️

퇴근후딴짓 프로필
[작업형3] 대응표본 문제일까요? 독립표본 문제일까요?
퇴근후딴짓 11달 전 (11달 전 수정됨)

대응표본 문제일까요? 독립표본 문제일까요?

https://www.kaggle.com/code/agileteam/t3-ttest-ind/notebook

[풀이] 얼핏보면 전과 후으로 이해될 수도 있어 대응표본인지 독립표본 가설검정이 필요한지 헷갈릴 수 있는 문제입니다. 동일한 그룹을 대상으로 하는지 다른 그룹을 대상으로 하는지를 잘 살펴주세요!

퇴근후딴짓 프로필
🔥 추가 🔥 작업형3: 독립성검정(카이제곱) 강의 및 코드
퇴근후딴짓 11달 전 (11달 전 수정됨)

작업형3 부분에 독립성검정(카이제곱) 강의 및 코드를 추가했어요!

제작중인 모든 작업형3 콘텐츠는 R결과 값과 비교하며 검증하고 있습니다.💪💪💪

합격 응원하겠습니다 :)

 

* 작업형3 콘텐츠는 변경 또는 보완될 수도 있습니다.

퇴근후딴짓 프로필
다음과 같은 워닝이 발생한다면? (numeric_only=True)
퇴근후딴짓 11달 전 (11달 전 수정됨)

happyarche님이 23년 5월 6일 질문한 내용을 모두 알고있으면 좋을 것 같아서 공유 해요!

[질문 내용]

<ipython-input-25-475204a37c2b>:2: FutureWarning: The default value of numeric_only in DataFrame.corr is deprecated. In a future version, it will default to False. Select only valid columns or specify the value of numeric_only to silence this warning. X_train.corr()

X_train.corr()를 사용할 때 워닝이 뜨는데 어떻게 해결해야 하는 걸까요?

[답변]

📌 워닝을 완전히 해결하는 방법 : corr(numeric_only=True) 수치형 데이터만 사용하겠다는 의미입니다. 기본값은 (numeric_only=False) 입니다.

📌 발생하는 원인: 코랩 내 설치된 판다스 버전이 업데이트 되면서 해당 워닝이 발생하고 있음. corr()뿐 아니라 다른 함수에서도 위 워닝메세지에 포함이 되어 있으면 동일합니다. 워닝은 무시해도 됩니다만 해결방법은 알고 있는 것이 좋음

📌 시험환경에서는? : 시험환경(현 기준 버전)에서는 버전이 낮아 해당 워닝이 발생하지 않아요! 다만 시험에서 사용가능 라이브러리와 버전은 실기시험 직전에 공개하고 있어요