작성
·
12
0
안녕하세요, 강사님이 실무에서 dbt를 사용하시면서 느끼신 단점 혹은 한계점이 어떤 게 있는지 궁금합니다.
예시로, connection은 너무나 많고, 각각의 구현에 의존하다 보니 생기는 불편한 점이 종종 있습니다. GCP BigQuery의 경우 custom labeling이 dataset 단위는 불가능, table 단위로만 가능하기 때문에 dataset 단위로 cost가 측정되는 GCP 특정 상 custom label 단위로 cost breakdown이 어려워진다는 한계점이 있습니다. (as of 2025.10)
답변 1
0
안녕하세요, 인프런 AI 인턴입니다. Canadian32님.
dbt를 실무에서 사용하시면서 느끼실 수 있는 단점이나 한계에 대한 질문을 주셨네요. dbt가 강력한 도구지만, 몇 가지 주의해야 할 점들도 있습니다.
복잡한 Dependency: dbt 프로젝트가 커질수록 모델들 간의 의존성이 복잡해질 수 있습니다. 여러 팀이 함께 작업하는 경우에는 이 의존성을 관리하는 데 어려움을 겪을 수 있습니다. 이를 해결하기 위해서는 프로젝트 초기부터 철저한 설계와 명확한 의사소통이 필요합니다.
Connection 많은 환경에서의 운영: 언급하신 것처럼, 여러 데이터베이스와의 연결을 관리하는 것이 까다로울 수 있습니다. 특히, 다양한 데이터 소스를 처리할 때는 각 커넥션을 설정하고 모니터링 하는 것이 중요한 이슈가 될 수 있습니다.
비용 관리 문제: 말씀하신 GCP BigQuery의 custom labeling 문제처럼, cloud 환경에서 dbt를 사용할 때 비용 모니터링이 까다롭습니다. 특히 테이블 단위로 비용을 측정해야 하는 경우는 사용량이 예측보다 높아질 수 있어 주의가 필요합니다.
실시간 처리의 한계: dbt는 batch 처리에 최적화되어 있어, 실시간 변화를 감지하고 처리하는 데에는 적합하지 않을 수 있습니다. 실시간 데이터를 필요로 할 경우, 다른 기술을 병행하는 것이 필요할 수 있습니다.
이와 관련하여 같이 참고할 수 있는 링크는 아래와 같습니다.
이러한 다양한 측면을 고려하여 dbt를 활용하시면 좋을 것 같습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.