강의

멘토링

로드맵

인프런 커뮤니티 질문&답변

Bruce Han님의 프로필 이미지
Bruce Han

작성한 질문수

스프링부트로 직접 만들면서 배우는 대규모 시스템 설계 - 게시판

좋아요 수 설계 - 테이블 정의

락 오래 점유 시 장애 발생 가능성 질문

해결된 질문

작성

·

16

0

9:55 쯤에

락을 오래 점유하면 발생하는 문제는 치명적이고 다양하다.

리소스 고갈 등으로 인해 장애가 발생할 수 있는 것이다.

지식공유자님께서는 오래 점유하는 상황에서 겪으셨던 문제가 있었나요?

좋아요라는 게, 네트워크 문제가 아닌 이상 빠르게 끝날 처리인데, 혹시 좋아요 말고도 (다른) 쓰기 상태에서 락을 오래 점유하고 있을 때 어떤 문제를 겪으셨는지, 어떻게 해결하셨는지 러프하게라도 말씀해 주시면 감사드리겠습니다!!

 

감이 잘 안 와서 궁금해서 질문드립니다.

답변 2

0

쿠케님의 프로필 이미지
쿠케
지식공유자

Bruce Han님, 안녕하세요!

 

락을 오래 점유하고 있으면 여러 문제로 이어질 수 있습니다.

아래 흐름을 살펴보시면 조금 더 와닿으실 것 같네요.

애플리케이션에서 DB에 쿼리를 수행 했고, 락으로 인해 처리에 지연이 생긴다고 가정해보겠습니다.

극단적으로 1번의 쿼리에 1초가 걸린다고 했을 때, 1000개의 쿼리가 동일한 락에 대해 동시 요청이 들어오면 1000초가 걸리게 됩니다.

단일한 쿼리는 클라이언트에게 즉시 응답이 될 수 있겠지만, 동시 요청이 많으면 클라이언트 응답 지연은 커지게 됩니다.

또, 각 쿼리에 대해서 보통 타임아웃을 설정하게 되는데(데드락이 발생할 수도 있고 쿼리를 무한정 대기할 수는 없으므로), 이러한 경우 정상적으로 요청을 해야하는데도 실패 응답이 만들어질 수 있습니다.

클라이언트에게 실패 응답을 내려준다면, 이에 대한 정책 정리나 롤백 플랜 등도 당연히 필요할 것이고요.

그리고, 커넥션 수에 대해서는 보통 제한을 걸어두게 됩니다.

DB에서 최대 커넥션 수에 대한 제한, 각 애플리케이션마다 DB와 맺을 수 있는 커넥션 풀 수 설정하는 부분입니다.

만약 특정한 쿼리가 락으로 인해 응답이 지연된다면, 커넥션을 다시 맺을 수 있는 상황이 오기 전까지 다른 요청들은 대기 또는 실패하게 됩니다.

대기하는 요청들이 많다면, 요청 스레드들은 모두 블로킹 상태에서 대기하게 되고, 새롭게 들어오는 요청들은 처리되지 못하며, 애플리케이션의 cpu/memory 사용량만 올라가게 될 수 있습니다.

이 경우 애플리케이션은 요청을 처리하지 못하는 상태가 되어 시스템 장애가 발생할 수도 있는 것이고요.

또, 여러 요청 간에 락을 점유하면서 경합이 일어나면 데드락이 발생할 수도 있습니다. 이 경우 직접 DB에서 정리해야하는 상황이 생길 수 있고, DB에서도 요청을 처리하지 못하고 대기하며 커넥션 등 리소스는 낭비됩니다.

 

해결책은 쿼리가 빠르게 처리되도록 인덱스를 설정한다든가, 별도의 태스크에서 일부 데이터씩만 나눠서 느리게 처리한다든가(비동기 처리해도 되는 경우), 트랜잭션의 범위를 좁힌다든가, 격리 레벨을 낮춘다든가 등 고정된 답이 있다기보단 시스템이나 상황별로 다를 것 같습니다.

 

그리고 강의에서는 레코드 락에 대해서만 다루었는데요, 해당 락 외에도 다른 락 종류들도 많습니다.

이러한 락들은 상황별로 다른 종류의 락이 잡힐 수도 있고, 락이 발생하는 원인도 다를 수 있습니다.

이 부분은 DB에 대한 내용이고 너무 깊고 방대하기 때문에 저도 여기에서 다루긴 어렵고, 학습도 겸하며 천천히 경험적으로 익혀 나가시면 될 것 같습니다.

데이터베이스는 따로 깊이 학습해 보시면 좋지만, 사실 미리 다 알아둘 수도 없고, 그럴 필요도 없고, 직접 운영하고 경험하며 문제가 발생했을 때 원인을 찾을 수 있는 정도로 알아두면 충분하다고 생각되네요.

0

안녕하세요, 인프런 AI 인턴입니다. Bruce Han님.

질문해주신 내용은 데이터베이스에서의 락 점유 시간과 그로 인한 문제에 관한 것으로, 특히 락이 오래 걸려 있는 경우 시스템에 미치는 영향에 대해 궁금하신 것 같습니다.

락의 오래된 점유로 인한 문제점

  1. 리소스 고갈:

    • 락이 오랜 시간 걸려 있으면, 해당 리소스에 접근해야 하는 다른 트랜잭션들이 대기 상태에 있게 됩니다. 이는 결국 시스템 전체의 응답 시간을 증가시키고, 일종의 병목 현상을 초래할 수 있습니다.
  2. 데드락 가능성:

    • 여러 트랜잭션이 서로 기다리면서 교착 상태가 되는 데드락이 발생할 수 있습니다. 이는 시스템의 가용성을 떨어뜨리므로 지속적인 모니터링과 적절한 트랜잭션 설계가 필요합니다.
  3. 응답 지연:

    • 웹 어플리케이션에서 클라이언트가 빠른 응답을 기대하는 경우, 이런 락으로 인한 지연이 사용자 경험을 떨어뜨리고, 심각한 경우 사용자가 요청을 포기할 수 있습니다.

해결 방법

  • 락 점유 시간 줄이기: 트랜잭션의 범위를 최소화하여 꼭 필요한 부분에서만 락을 사용하도록 설계할 수 있습니다.
  • 낙관적 락 사용: 충돌이 적을 것으로 예상되는 경우, 낙관적 락을 사용하여 락 점유 시간을 줄이는 것도 한 방법입니다.
  • 비동기 처리: 중요도가 낮은 쓰기 작업은 비동기적으로 처리하여 응답 속도를 개선할 수 있습니다.

관련 정보

비슷한 주제를 다룬 질문 및 답변이 인프런 커뮤니티에 많이 있습니다. 예를 들어, 데이터베이스 락과 동시성 문제 해결 방법 (게시글 제목)에서는 관련된 상황에서의 다양한 해결 사례를 다루고 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

Bruce Han님의 프로필 이미지
Bruce Han

작성한 질문수

질문하기