1일 전 (1일 전 수정됨)
꿀팁 섹션에서 작업형2 마인드맵 🆕 updated 2024.6 (only 자료) 를 참고해 주세요
작업형2가 알고 나면 패턴이 있어 작업형 1과 3에 비해 쉬운데
힘들어하는 분들이 계셔서 마인드맵으로 정리했어요
단, PDF만 제공하고 있어요(영상x) 🔥 화이팅입니다. 조금만 더 힘내보시죠!!
월 19,800원
5개월 할부 시꿀팁 섹션에서 작업형2 마인드맵 🆕 updated 2024.6 (only 자료) 를 참고해 주세요
작업형2가 알고 나면 패턴이 있어 작업형 1과 3에 비해 쉬운데
힘들어하는 분들이 계셔서 마인드맵으로 정리했어요
단, PDF만 제공하고 있어요(영상x) 🔥 화이팅입니다. 조금만 더 힘내보시죠!!
8회 준비는 혼자 하셔도 충분하지만, 함께 공부하고 싶으신 분들을 위해 스터디 모임을 마련했습니다.
매회차마다 오징어 게임을 운영하고 있는데 이 모임 입장은 자유로운 대신 지켜야 할 규칙이 있습니다.
📌 그라운드 룰:
미션을 수행하지 않으면 제거되는 모임이니 동의하는 분만 입장 부탁드려요 🙂
누구에게나 오픈된 공간이므로 디스코드에서는 질문을 받지는 않습니다.
제게 하고 싶은 질문은 인프런을 통해서 부탁드려요:)
📌 디스코드 : https://discord.gg/8WKn5FtrDW
접속하셔서 #전체-공지사항 채널에 있는 글 반드시 확인 부탁드립니다.
응원합니다:)
빅데이터 분석기사 실기 7회 기출 유형
강의를 업데이트하였습니다.
7회 합격 응원하겠습니다. 👏👏👏👏👏 함께 열심히 시작해 보시죠!!
추가 영상을 업로드 했어요!
dir과 help 완벽 마스터
인코딩 방법 정리
csv
시험응시전략
등 시험 전에 정리에 도움이 되었으면 합니다.
시험 잘 응시하고 꼭 합격하셔서 후기 기대하겠습니다 🥳
(위 영상은 임시로 끝에 두었으며 추후 정리될 예정입니다)
7회를 준비하기 연습하기 좋은 대회(데이터)가 있어 공유해요
화이팅입니다. 👏👏👏
url: https://dacon.io/competitions/official/236193/overview/description
베이스라인(기초 코드): https://dacon.io/competitions/official/236193/codeshare/9409
평가지표: RMSLE
주요 학습 포인트
시계열 데이터가 나왔을 때는 연,월,일을 새로운 피처로 생성 필요
test 컬럼에 없는 train 컬럼은 삭제
train, test 범주형 변수 카테고리(종류)가 다르다면?
rmsle 평가지표는 어떻게 구현할까?
url: https://dacon.io/competitions/official/236179/overview/description
베이스라인(기초 코드): https://dacon.io/competitions/official/236179/codeshare/9434
평가지표: f1-macro
주요 학습 포인트
이진 분류에도 f1-macro 평가지표 사용가능함
시험과의 차이점은 아래 대회는 csv생성시 test_id값과 예측값을 함께 만들어야 하고
시험은 예측값만 csv로 만들면 됩니다.
7회 실기시험 응시자는 꼭 꼭!! 확인해주세요 🙂
윈도우 기본메모장을 사용할 수 없어요!! -> 시험환경 내에서 제공되는 별도 메모장 사용
공식 예비문제 작업형2 강의를 업데잇 햇어요! 시험 전에 꼭 살펴보세요!
3개의 데이터가 아닌 2개의 데이터로 제공
roc-auc 평가 지표만 있을 뿐 확률로 제출하란 말이 없음
카테고리가 많아 눈으로 비교 불가능할 때 비교 방법
train_test_split없이 제출도 가능
레이블 인코딩
등을 다루고 있어요!!
결측치 처리
인코딩 (레이블 또는 원핫 중 택1)
train_test_split
스케일링
한 달간 대화하면서 함께 공부하고자 디스코드에 공간을 만들었습니다.🙌
닉네임 + 간단 미션을 수행하면 입장 권한이 부여됩니다.
Community Based Learning!!
그라운드 룰: 미션을 수행하지 않으면 제거 됩니다.
공지사항을 확인 후 7회 준비 방으로 오셔서 함께 공부해요!! https://discord.gg/25jF8EaY3F
단, 이 곳은 제게 질문하는 곳은 아닙니다.
제게 직접 답을 듣고 싶은 질문은 인프런으로 부탁드려요!!🙏
7회 실기 고사장이 공개되었어요!🤗
미리 고사장 후보 1, 2 선정한다.
10월 30일(월) 10시 접수 시작과 동시에 접수한다.
여러분들이 원하는 곳에서 시험을 응시했으면 하는 바램입니다.
매 시험마다 고사장이 변경되고 있어 비교는 어렵지만 서울 기준 - 강남역, 신촌역 등 역 주변이 가장 빨리 좌석이 사라졌어요. 시설이 좋다기보다 시험 시작 시간에 늦지 않고 도착하기 좋은 곳입니다 :)
접수 일정 잊지 않도록 미리 알람/캘린더에 등록하길 추천해요!
No. 지역 고사장명 주소 잔여좌석
1 (서울) 서경대학교 북악관 서울 성북구 서경로 124 서경대학교 북악관 322
2 (서울) 성공회대학교 이천환기념관 서울 구로구 연동로 320 성공회대학교 이천환기념관 108
3 (서울) 한성대학교 탐구관 서울 성북구 삼선교로16길 116 한성대학교 탐구관 123
4 (서울) 한양여자대학교 정보문화관 서울 성동구 왕십리로 222 한양여대 정보문화관 423
5 (서울) 광운인공지능고등학교 서울 노원구 광운로1길 24 광운인공지능고 창조관 102
6 (서울) 서울디지텍고등학교 서울 용산구 회나무로12길 27 서울디지텍고등학교 114
7 (서울) 선린인터넷고등학교 서울 용산구 원효로97길 33-4 선린인터넷고 3호관 194
8 (서울) 선일빅데이터고등학교 서울 은평구 갈현로29길 27 선일빅데이터고등학교 150
9 (서울) 성동공업고등학교 서울 중구 다산로 290 성동공고 창조관 227
10 (서울) 구디아카데미 서울 금천구 가산디지털2로 95 구디아카데미(KM타워 3층) 144
11 (서울) 비트교육센터 서울 서초구 서초대로74길 33 비트교육센터(비트빌) 151
12 (서울) 서울IT아카데미 홍대 서울 마포구 양화로12길 23 서울IT아카데미 홍대 99
13 (서울) 아이티윌 서울 강남구 테헤란로 124 아이티윌(삼원타워 4층) 240
14 (서울) 이젠아카데미 신촌 서울 서대문구 신촌로 141 이젠아카데미 신촌(위고인호스텔) 67
15 (서울) 중앙정보기술인재개발원 이대ㆍ신촌 서울 마포구 신촌로 176 중앙정보기술인재개발원 이대ㆍ신촌(중앙빌딩) 139
16 (서울) 중앙정보기술인재개발원 강남 서울 강남구 테헤란로7길 7 중앙정보기술인재개발원 강남(에스코빌 6층) 79
17 (서울) 한국IT직업전문학교 양재관 서울 서초구 바우뫼로 87 한국IT직업전문학교 양재관 181
18 (서울) 한국정보교육원 서울 관악구 봉천로 227 한국정보교육원(보라매샤르망 5층) 129
19 (서울) 휴먼교육센터 서울 영등포구 영중로8길 6 휴먼교육센터(성남빌딩 B동 6층) 80
20 (경기) 장안대학교 정보통신관 경기 화성시 봉담읍 삼천병마로 1182 장안대학교 정보통신관 356
21 (경기) 한봄고등학교 경기 수원시 권선구 호매실로 46-93 한봄고등학교 54
22 (경기) 강림직업전문학교 별관 경기 평택시 원평로84번길 28-22 강림직업전문학교 별관 60
23 (경기) 그린컴퓨터아카데미 안산 경기 안산시 단원구 중앙대로 921 그린컴퓨터아카데미 안산(동서코아 3층) 103
24 (경기) 연세IT미래교육원 경기 수원시 장안구 정조로 940-1 연세IT미래교육원 120
25 (경기) 우리인재개발원 경기 부천시 부천로29번길 7 우리인재개발원 60
26 (인천) 한국폴리텍II대학 인천캠퍼스 5기술관 인천 부평구 무네미로448번길 56 한국폴리텍II대학 인천캠퍼스 5기술관 2층 64
27 (인천) 그린컴퓨터아카데미 인천 인천 부평구 부평대로 19-1 그린컴퓨터아카데미 인천(신도시프라자빌딩 9층, 10층) 100
28 (인천) 다산직업전문학교 인천 미추홀구 주안로 108 다산직업전문학교(경향프라자 9층) 100
29 (대전) 그린컴퓨터아카데미 대전중앙 대전 중구 대종로 484 그린컴퓨터아카데미 대전중앙(JS그린빌딩 7층) 90
30 (대전) 미래융합교육원 대전 서구 계룡로491번길 86 미래융합교육원 72
31 (대전) 비젼직업전문학교 대전 중구 중앙로137번길 27 비젼직업전문학교 75
32 (대전) 세잔IT직업전문학교 대전 중구 중앙로137번길 36 세잔IT직업전문학교 77
33 (대전) 우쌤전산세무회계직업전문학교 대전 서구 둔산서로 3 우쌤전산세무회계직업전문학교 (선우빌딩 11층) 66
34 (대전) 그린컴퓨터아트학원 대전캠퍼스 대전 서구 대덕대로 182 그린컴퓨터아트학원 대전캠퍼스(오라클빌딩) 121
35 (대구) 경북산업직업전문학교 대구 동구 동부로 121 경북산업직업전문학교 172
36 (대구) 예담직업전문학교 대구 중구 중앙대로 403 태왕아너스타워 5층 예담직업전문학교 70
37 (대구) 한국디지털직업전문학교 대구 동구 신암로 128 연곡빌딩 3층 한국디지털직업전문학교 108
38 (대구) 그린컴퓨터아트학원 대구캠퍼스 대구 중구 중앙대로 394 그린컴퓨터아트학원 대구캠퍼스(제일빌딩) 121
39 (부산) 그린컴퓨터아카데미 부산서면2별관 부산 부산진구 중앙대로 749 그린컴퓨터아카데미 부산서면2별관(혜도빌딩 4층) 124
40 (부산) 부산더조은직업전문학교 부산 부산진구 신천대로50번길 79 부산더조은직업전문학교(더조은컴퓨터아카데미 5층) 100
41 (부산) 부산메인직업학교 부산 사하구 낙동대로 332 부산메인직업학교 (희망빌딩) 80
42 (부산) 새동아직업전문학교 부산 사하구 하신중앙로 323 전원빌딩 새동아직업전문학교 120
43 (부산) 센텀직업전문학교 부산 해운대구 센텀중앙로 48 센텀직업전문학교(에이스하이테크21 5층) 75
44 (광주) 한국폴리텍V대학 광주캠퍼스 광주 북구 하서로 85 한국폴리텍V대학 광주캠퍼스 서석관, 본관 50
45 (광주) 광주국제직업전문학교 광주 북구 호동로 6-6 광주국제직업전문학교 (전대점) 140
46 (광주) 그린컴퓨터아트학원 광주첨단 광주 광산구 임방울대로 782 그린컴퓨터아트학원 광주첨단(한아름빌딩 2층) 72
47 (울산) 울산직업전문학교 울산 남구 삼산로 111 울산직업전문학교(현은빌딩) 120
48 (강원) 더조은컴퓨터아트학원 춘천 강원 춘천시 경춘로 2362 더조은컴퓨터아트학원 춘천(GU빌딩 8층) 90
49 (제주) 제원직업전문학교 제주특별자치도 제주시 노연로 119 제원직업전문학교(장주빌딩 3층) 50
다중분류 평가지표에 대해 안내해요💪💪💪
문제에서 요구하는 대로 평가지표를 사용하면됩니다.
만약 모르겠으면 알고 있는 평가지표를 편법으로나마 활용해주세요:)
predict로 예측
micro, macro, weighted
from sklearn.metrics import f1_score
f1_score(y_true, y_pred, average='macro') # micro, macro, weighted
predict로 예측
from sklearn.metrics import accuracy_score
accuracy_score(y_true, y_pred)
predict_proba로 예측 -> 이진분류처럼 pred[:,1] ❌ pred 그대로 👌
ovo, ovr
from sklearn.metrics import roc_auc_score
roc_auc_score(y_val, pred, multi_class='ovo')
roc_auc_score(y_val, pred, multi_class='ovr')
🆕 "lightGBM 활용" 영상을 추가했습니다.
범주형 데이터 인코딩 없이
결측치 처리 없이
lightGBM은 사용가능합니다. :)
🆕 기출 5회 작업형1 영상 추가
코드만 있었는데 설명 영상을 추가했습니다.💪💪💪
작업형2 어떤 모델을 준비해갈 예정이세요?
1. 랜덤포레스트 분류/회귀
2. lightGBM 분류/회귀를 추천합니다.
lightGBM은
XGBoost와 함께 인기 있는 부스팅계열 모델입니다.
학습과 예측 속도가 XGBoost에 비해 빠릅니다.
영상 제작 당시엔 lightGBM을 지원하지 않았지만 지금은 시험환경에서도 사용 가능합니다.
XGBoost가 실행은 잘 되지만 간혹 워닝이 발생하네요. XGBoost대신 lightGBM을 준비하는 것을 추천해요
####### 분류 #######
import lightgbm as lgb
model = lgb.LGBMClassifier()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
# y_pred = model.predict_proba(X_test) #평가기준 roc-auc일 때
####### 회귀 #######
import lightgbm as lgb
model = lgb.LGBMRegressor()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
# 하이퍼파라미터 튜닝은 xgboost(작업형2 모의고사3 강의)과 동일하게 사용하면 됩니다.
# 예: max_depth=5, n_estimators=600, learning_rate=0.01
체험하기 - 작업형3 답안 제출 포멧이 공개 되었어요.
작업형3은 귀무가설을 기준으로 검정의 결과를 (채택/기각) 합니다.
체험하기 링크: https://dataq.goorm.io/exam/116674/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/4
6회 실기 고사장이 공개되었어요!
미리 고사장 후보 1, 2 선정한다.
5월 22일(월) 10시 접수 시작과 동시에 접수한다.
수강 신청 만큼 힘든 건 전혀 아니지만
그래도 여러분들이 원하는 곳에서 시험을 응시했으면 하는 바램입니다.
시험마다 고사장이 변경되고 있어 비교는 어렵지만
예를들면 서울에서는 강남역 옆(10번)과 신촌역 옆(9번)이 가장 빨리 좌석이 사라지지 않을까 싶네요!
시설이 좋다기보다 역 옆이라 시험 시작 시간에 늦지 않고 도착하기 좋은 곳입니다 :)
경기도 지역은 고사장이 없었는데 이번에 수원도 고사장이 생겼네요!!
접수 일정 잊지 않도록 미리 캘린더에 등록하길 추천해요!
빅데이터 분석기사 실기를 혼자 준비하기 어렵다면 함께 공부해요!!
해당 스터디 모임은 인프런 강의와는 별개로 진행하는 모임입니다.
일반적인 스터디와 달리 매일 미션 수행이 없으면 정말로 제거(퇴장)되는 모임임을 기억해주세요 🙌
의지가 약한 분에게 강력 추천해요 :)
📌 모집기간: ~5. 21(일)까지 모집
📌 방식: 디스코드 활용 (매일 미션 제출)
📌 기간: 5월 15일(월) ~ 6월 24일(토)
📌 안내 및 참가: (마감)
혼자가 편하다면
https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr 를 활용해 주세요!
이곳에 있는 내용을 활용해 모임에서 매일매일 풀어나갈 예정이에요!
[주의] 디스코드에서는 제게 질문을 해도 답을 드리진 않습니다. 수험생 간 질문과 답변을 하고 있어요 ~
제게 답변을 듣고 싶다면 인프런을 활용해주세요🙇🏼♂️