product의 name 필드로 상품 검색시 생성한 gin index사용 여부

Question

안녕하세요 강사님! 상품검색 - 한글 full-text search 구현 부분 듣다가 궁금한 점이 생겨 질문 남깁니다. product_list_handler에서 query가 있을 때, products를 필터하는 orm에서 100개로 갯수를 제한하는데요. 강의에서처럼 explain으로 쿼리 실행계획을 볼 때, 데이터가 얼마 없을때는 full scan을 하고, 많으면 모델에서 생성한 'product_name_gin_index'를 통해 scan을 하더라구요. 언제부터 인덱스에서 스캔하나 궁금해서 limit를 늘려가면서 확인했는데, 제 로컬에서는 limit가 12,800개가 넘어갈 때 인덱스를 사용하더라구요. 이렇게 되면 100개로 제한해서 쿼리하면 어차피 인덱스를 사용하지 않을것 같은데 맞나요? 맞다면 결과적으로 product_name_gin_index 인덱스를 사용하지 않는데, 이 인덱스를 생성한게 의미가 있을까요?? 응답할 때 페이지네이션을 필요하니까 한번에 10,000개 이상 보낼 일은 없을 것 같은데 인덱스를 생성한 장점이 있는지 궁금합니다! def product_list_handler( request: HttpRequest, category_id: int | None = None, query: str | None = None ): """ 쿼리 파라미터인 category_id, query에 따라 상품 목록 조회 API """ if query: products = Product.objects.filter( name__contains=query, status=ProductStatus.ACTIVE )[:100] ... (생략) pass

신동현 · Answer

안녕하세요! 말씀 주신 테스트 상황이 데이터를 충분히 많이 생성한 상태에서 limit을 100개로 쿼리한 경우에 풀 스캔을 사용하였다는 말일까요? 데이터가 적은 경우에는 몇 개를 쿼리하든 풀 스캔을 사용할 확률이 높습니다. (정확한 임계치는 데이터베이스 엔진에서 결정하기 때문에 상황에 따라 달라집니다.) 데이터가 충분히 많은 경우에는 반대로 index를 활용할 확률이 높아집니다. 실제로 제가 실습에서 보여드린 예제에서도 실습 쿼리 문에 limit을 지정하진 않았지만 IDE에 의해서 자동으로 limit이 500으로 고정되어 있습니다! 예외적으로 데이터가 충분히 많더라도 전체를 전부 스캔하려고 하면 풀 스캔이 사용될 수도 있습니다.