DW의 star-schema 생성
142
6 câu hỏi đã được viết
(질문전 반드시 AI-assitant와 먼저 해결해보세요!)
1. 이 문제를 해결해보기 위해 어떤 시도를 해보셨나요?
2. 질문 내용만 보았을 때, 답변자가 질문의 의도를 쉽게 이해할 수 있는 컨텍스트가 다 들어있나요? (영상 xx:yy ~ zz:aa 부분, 시도해본 작동하는 전체 코드 등)
안녕하세요! dbt 강의 너무 재미있게 공부하고있습니다.
미국에서 공부하고 있어 dbt가 얼마나 강력하고 많은 곳에서 원하는지 몸으로 체감하고 있습니다.
혹시 궁금한 부분이 기존 ETL의 경우 Transform단에서는 데이터 전처리, 타입 변환 등이 수행되고 DW staging db 단에 load 된 후에 여기서 table간의 조인 등의 처리로 Star-schema (Fact, dimension tables) 이 개발되는 것으로 알고 있습니다.
dbt의 경우 말씀해주신대로 ELT 방식으로 DW로 load된 후에 Transform되는 방식인데요.
dbt가 그럼 Star-schema (Fact, dimension tables) 개발를 개발하는 단계에도 관여를 하는 걸로 이해하면될까요? (e.g. BIgQuery에서 개발되는 것이 아닌 dbt 상에서 개발하게 되는지)
답변 주시면 감사하겠습니다!
Câu trả lời 1
1
네, 이게 팀이나 사용방식에 따라 차이가 있겠지만, 저 같은 경우는 dbt 를 이용해서 modeling 까지 가미해서 warehouse를 구축합니다. 실제 source로 등록되는 데이터들이 f/d 형태의 데이터가 아닌, 실제 서비스 운영에 특화된 데이터 포멧이라, dbt를 이용해서 f/d 모델링은 높은 확률로 다 하게되는 것 같아요
문제에 첨부된 예시와 실제 출력된 샘플 비교
0
4
1
원핫 인코딩 관련
0
9
1
타겟 분리
0
7
1
Id 삭제
0
9
1
roc_auc_score 질문: 작업형2 모의문제3 09분 48초
0
12
1
원핫인코딩 코드 질문
0
12
1
map 함수 사용 필수적인가요
0
16
1
수강 기한 연장 문의드립니다.
0
21
1
34강 평가지표
0
25
2
103강 작업2형 전처리(레이블인코딩 부분) 오류
0
17
2
작업형1_section14 문의
0
16
2
작업형1_연습문제 7번 관련입니다.
0
17
2
데이터 프레임 슬라이싱 혹은 데이터 선택하기가 어렵습니다.
0
18
2
크로스 밸리데이션 질문
0
22
2
로지스틱 회귀분석 질문
0
20
2
accuracy_score() 사용 시 인자 순서 오류 관련
0
17
2
수치형 데이터만 선택하여 푸는 경우에 오답확률이 높아질까요?
0
26
2
2유형 object 컬럼 인코딩 관련 질문
0
36
2
하이퍼파라미터 변수
0
33
2
52강 이원분산분석
0
27
2
확인부탁드려요
0
54
1
dbt의 한계점
0
101
1
강의 관련 질문
2
104
2
data 라는 폴더가 없습니다.
0
104
1

