Distinct 와 Set 사용에 대해서 질문이 있습니다.
일대다 관계에서 컬렉션을 조회하면
조회 결과 테이블을 엔티티에 매핑하다보니
JPA는 그대로 중복된 객체를 반환한다고 이해를 했습니다.
그런데 중복을 제거하기 위해서 Distinct 연산자를 붙이면
쿼리에도 Distinct가 들어가면서 SQL이 실행이 되는데요
영속성 컨택스트에서 같은 식별자를 가진 엔티티는 동일성을 보장하니까
불필요한 SQL이 포함된 Distinct보다
HashSet<>으로 중복을 제거하는 방법은 별로일까요?
답변 2
1
안녕하세요. kamser님, 공식 서포터즈 코즈위버입니다.
Distinct 가 필요한 경우라면 쿼리에서 수행하는게 좋습니다. 백엔드에서 중복제거를 할 경우 페이징에서 문제가 될 수 있습니다. 물론 페이징이 필요하지 않은 데이터라면 백엔드에서 Set을 이용해 중복을 제거하는 것도 방법입니다.
감사합니다.
0
안녕하세요, 인프런 AI 인턴입니다.
distinct 키워드를 사용하는 것은 JPQL에서 중복을 제거하는 표준적인 방법이며, SQL 쿼리에서도 distinct가 적용되어 중복 데이터가 반환되지 않게 됩니다. 영속성 컨텍스트는 실제로 동일한 식별자를 가진 엔티티에 대해 한 개의 인스턴스만 관리하기 때문에, 결과적으로 같은 식별자를 가진 엔티티 객체는 중복되지 않게 됩니다.
그러나 경우에 따라 distinct가 SQL 수준에서 원하는 결과를 내지 못하는 상황이 발생할 수 있습니다. 이런 상황에서는 HashSet<>을 사용해서 애플리케이션 레벨에서 중복을 제거하는 것도 하나의 선택지입니다. 하지만 이 경우, 먼저 모든 결과를 메모리에 로드한 다음 중복을 제거하기 때문에 대량의 데이터를 처리해야 할 때 성능에 부정적인 영향을 줄 수 있고, 더 많은 메모리를 사용할 수도 있습니다.
언급하신 방법을 사용하는 것이 별로인지에 대한 판단은 애플리케이션의 특성과 요구 사항, 성능 요구사항 등을 고려하여 결정되어야 합니다. 또한, @Query 어노테이션을 사용하여 JPQL 혹은 네이티브 쿼리에서 필요한 데이터만 선택적으로 조회하는 방법을 사용할 수도 있습니다. 이를 통해 불필요한 데이터 전송을 줄이고, 중복을 더 효과적으로 제어할 수 있습니다. 자세한 내용은 Spring Data JPA 참조 문서를 참고하시는 것이 좋을 것 같습니다.
Spring Data JPA - Reference Documentation - Query Creation
Kamser님 질문에 도움이 되었기를 바랍니다!
inheritance startegy 선택시 고려사항
0
11
0
Entity 동등성 비교
0
14
1
실무 조언 관련 질문입니다.
0
41
1
H2데이터베이스 파일 생성
0
52
2
서브쿼리 강의에서 ALL 예시 관련 질문드립니다.
0
49
2
수정또는 삭제시 영속성 엔티티에 값이 무조건 있어야 하나요?
0
48
1
JPQL 메소드와 락
0
53
1
Delivery @OneToOne
0
57
1
17강 4~5분대 테이블 값 조회가 안됩니다.
0
89
2
UnsupportedOperationException 발생
0
82
3
H2 Database 연결이 안됩니다.
0
89
2
연관관계 매핑 질문드립니다.
0
82
2
h2데이터베이스 실행오류
0
105
2
persistence.xml
0
103
2
양방향 연관관계에서 연관관계의 주인(mappedBy)을 왜 꼭 정해야 하나요?
0
77
1
영속성 컨텍스트
0
62
1
JPA 프록시
0
90
1
Native Query와 MyBatis
0
63
1
영속성 컨텍스트는 어떤 메모리에 저장되는건가요?
0
84
1
임베디드 타입 예시 코드 관련 질문
0
112
3
명시적 조인에서 별칭을 주면 왜 객체에 접근할 수 있나요
0
91
3
인텔리제이 패키지 커서 단축키 질문
0
106
2
혹시 현재는 ID 데이터 타입이 String이면 안되나요?
0
137
1
양방향 연관관계 시 연관관계 주인을 설정하는 이유
0
68
1





