inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

실전! 스프링 부트와 JPA 활용2 - API 개발과 성능 최적화

default_batch_fetch_size 관련질문

해결된 질문

4868

asdkfur

작성한 질문수 22

17

안녕하세요 선생님 최근 default_batch_fetch_size 관련 질문과 비슷한 상황이지만 조금 다릅니다.

현재 A 테이블과 B테이블이 one to many 로 연관관계가 있고 현재 A 테이블 기준으로 쿼리를 날린다음(테이블 B는 페치조인하지 않음) 서비스 단에서 (테이블 B)부분  lazy를 강제 초기화 해주고 있습니다.

제가 batchsize를 다르게 주면서 테스트를 해보았습니다.

1. 쿼리 결과물 : 180개(A 테이블 기준 결과물 갯수) B 테이블의 결과물은 1073개

default_batch_fetch_size=100

in 절에 나가는 batch size= 100, 50, 25, 5

총 4번 비정상 fetch size되로면 2번에 나가야함

2.쿼리 결과물 : 180개(A 테이블 기준 결과물 갯수) B 테이블의 결과물은 1073개

default_batch_fetch_size=80

in 절에 나가는 batch size= 80,80,20

총 3번 정상 

3.쿼리 결과물 : 180개(A 테이블 기준 결과물 갯수) B 테이블의 결과물은 1073개

default_batch_fetch_size=500

in 절에 나가는 batch size= 125, 31, 15 ,9 

총 4번 비정상 fetch size되로면 1번에 나가야함

4.쿼리 결과물 : 180개(A 테이블 기준 결과물 갯수) B 테이블의 결과물은 1073개

default_batch_fetch_size=180

in 절에 나가는 batch size= 180

총 1번 정상

5.쿼리 결과물 : 30개(A 테이블 기준 결과물 갯수) B 테이블의 결과물은 23개

default_batch_fetch_size=100

in 절에 나가는 batch size= 25, 5

총 2번 비정상 fetch size되로면 1번에 나가야함

6.쿼리 결과물 : 30개(A 테이블 기준 결과물 갯수) B 테이블의 결과물은 23개

default_batch_fetch_size=30

in 절에 나가는 batch size= 30

총 1번 정상

7.쿼리 결과물 : 30개(A 테이블 기준 결과물 갯수) B 테이블의 결과물은 23개

default_batch_fetch_size=20

in 절에 나가는 batch size= 20, 10

총 2번 정상

8.쿼리 결과물 : 30개(A 테이블 기준 결과물 갯수) B 테이블의 결과물은 23개

default_batch_fetch_size=500

in 절에 나가는 batch size= 15, 15

총 2번 비정상 fetch size되로면 1번에 나가야함

혹시 자체적으로 최적화 알고리즘이 적용되면서 이렇게 제각각 나가는건가요?

아니라면 혹시 저 in 절을 만드는 부분을 디버깅을 해볼려면 어떤 클래스를 찾아보면 될까요?

spring spring-boot java JPA

답변 2

31

김영한

안녕하세요. asdkfur님 좋은 질문입니다.

좀 깊은 내용이기는 하지만, 먼저 이렇게 동작하는 배경을 설명드릴께요.

보통 RDB들은 select * from x where in (?) 와 같은 preparedstatement는 미리 문법을 파싱해서 최대한 캐싱을 해둡니다.

그런데 데이터가 1개, 2개, 3개, 100개가 있으면 모두 각각 다음 처럼 최대 100개의 preparedstatement 쿼리를 만들어야 합니다.

select * from x where in (?)

select * from x where in (?, ?)

select * from x where in (?, ?, ?)

select * from x where in (?, ?, ? ...)

이렇게 되면 DB 입장에서 너무 많은 preparedstatement 쿼리를 캐싱해야 하고, 성능도 떨어지게 됩니다.

그래서 하이버네이트는 이 문제를 해결하기 위해 내부에서 나름 최적화를 합니다.

100 = 설정값

50 = 100/2

25 = 50/2

12 = 25/2

그리고 1~10까지는 자주 사용하니 모두 설정

이런식으로 잡아둡니다.

그러면 기존에 100개의 preparedstatement 모양을,  1~10, 12, 25, 50 ,100 해서 총 14개의 모양으로 최적화 할 수 있습니다.

이렇게 해서 100으로 최대값을 설정하고,

18을 설정하면 12, 6 이렇게 다음과 같이 나누어서 실행됩니다.

select * from x where in (?*12)

select * from x where in (?*6)

추가로 다음과 같은 속성으로 최적화 전략을 제어할 수 있습니다.

spring.jpa.properties.hibernate.batch_fetch_style: legacy //기본

spring.jpa.properties.hibernate.batch_fetch_style: padded

spring.jpa.properties.hibernate.batch_fetch_style: dynamic //최적화X

위에 말씀드린 전략이 기본 전략입니다.

최적화 대신에 설정한 값을 기준으로 사용하려면 dynamic를 선택하면 됩니다.(설명드린 내용 때문에 권장하지 않습니다.)

padded 전략은 다음을 참고해주세요: https://docs.jboss.org/hibernate/orm/4.2/manual/en-US/html/ch20.html#performance-fetching-batch

감사합니다^^

4

asdkfur

왜그런지 혼자 찾아보았지만 잘 나오지 않아  헤맸는데역시나 감사합니다. ㅎㅎ 

강의 관련 외 질문입니다.

0

65

2

SpringBoot4 + Hibernate7 모듈 등록 방법 공유

0

86

1

BeanCreationException

0

86

3

Update 후 UpdateMemberResponse 매핑할 때

0

46

1

트랜잭션을 사용 안 할 때 커넥션은 언제 가져오나요?

0

98

2

페이징 + 검색조건 관련해서 질문드립니다.

0

70

1

Query Dsl Q파일 질문입니다.

0

81

1

루트 쿼리라는것은

0

58

1

메서드를 분리하는 기준

0

62

1

findAllWithMemberDelivery 메서드 질문드립니다.

0

108

3

연관관계 매핑을 안 쓸 경우, 사용해야 하는 전략

0

83

2

fetch join과 영속화와 OSIV의 관계

0

84

2

Distinct 사용 전 결과에 대한 의문

0

113

2

레포지토리 계층에서의 트랜잭션에 대한 의문

0

56

1

영속성 컨텍스트 생명주기의 신기한 부분이 있습니다.

0

78

2

dto 필드 속 엔티티 여부

0

58

1

뷰템플릿 사용 시

0

76

2

Result 클래스 관련 질문

0

56

1

@PostConstruct 프록시 관련 질문드립니다

0

85

1

DTO 대신 Form 사용은 안되나요?

0

133

1

OSIV ON 상태일 때

0

95

1

fetch join VS fetch join 페이징 궁금증

0

179

2

양방향 연관관계 알아보는 법?

0

104

1

16강 17강 간단 정리 이게 맞을까요 ?

0

165

2