인프런 커뮤니티 질문&답변

뎅뚠

작성한 질문수

김영한의 실전 자바 - 중급 2편

해시 알고리즘6 - 해시 충돌 구현

해시 인덱스를 사용하는 경우 데이터 저장 평균 시간 복잡도에 대해 질문

해결된 질문

작성

수정됨

관련 내용:

강의: 55. 해시 알고리즘6 - 해시 충돌 구현 21:56
pdf: 6. 컬렉션 프레임워크 - 해시(Hash) 24P 정리 부분

해시 인덱스를 사용하는 경우 데이터 저장을 할 때 평균 시간복잡도가 O(1)이라고 설명.

의문점

private static void add(LinkedList<Integer>[] buckets, int value) {
    int hashIndex = hashIndex(value);
    LinkedList<Integer> bucket = buckets[hashIndex]; //O(1)
    if (!bucket.contains(value)) { //O(n)
        bucket.add(value);
    }
}

위와 같이 항상 bucket이 contains(..) 메서드를 호출하여 중복된 값이 있는지 확인하므로 O(n)의 시간 복잡도가 소요됩니다. 그래서 저는 항상 데이터 저장을 할 때는 O(n)으로 계산해야 한다고 생각했습니다.

강의에서 말씀하신 내용은 이상적으로 해시 충돌이 별로 발생하지 않는 상황(그리고 구체적인 구현은 신경쓰지 않는 상황)이라 가정하고 O(1)이라고 한 것일까요?

java 객체지향 코딩-테스트 알고리즘

답변 2

뎅뚠

질문자

자답

강의 해시 알고리즘6 - 해시 충돌 구현 15:02 부분에서 이미 설명한 내용.

데이터를 추가하는데 O(n)의 시간 복잡도가 소요.

그러나, 해시 충돌이 발생하지 않는 상황은 결국 각 bucket의 데이터가 0개나 1개 들어있는 거기때문에 contains(..)가 O(1)의 시간 복잡도로 소요된다.

따라서, 해시 인덱스를 사용하는 경우 데이터 저장을 할 때 평균 시간 복잡도가 O(1)이라 할 수 있다.

괜한 알람가게 해서 죄송합니다.

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

임형준님이 말씀하신 것처럼, 해시 테이블에서 데이터를 저장할 때 평균 시간 복잡도는 일반적으로 O(1)로 간주됩니다. 이는 해시 충돌이 거의 발생하지 않는 이상적인 상황을 가정한 것입니다. 해시 테이블의 기본 아이디어는 데이터가 고르게 분산되어 각 버킷에 하나의 요소만 저장되도록 하는 것입니다. 이 경우 데이터 접근과 저장은 직접적으로 해당 인덱스로 접근하므로 O(1)의 시간 복잡도를 갖습니다.

그러나, 실제 상황에서는 해시 충돌이 발생하고 여러 요소가 같은 버킷에 저장될 수 있습니다. 이 때는 contains()를 사용하여 중복 여부를 확인해야 하므로, 특정 버킷 내부에서의 연산은 O(n)이 될 수 있습니다. 이 때문에, 해시 테이블의 최악의 상황에서는 시간 복잡도가 O(n)로 증가할 수 있습니다.

강의에서는 해시 테이블의 이론적 장점과 가장 이상적인 상황을 설명하신 것으로 보입니다. 실제로는 해시 함수의 설계가 얼마나 잘 되느냐에 따라 성능이 달라질 수 있습니다.

관련 질문을 더 깊이 이해하는 데 도움이 될 수 있는 게시물로 아래 링크를 참고하여 주세요:

“6강 해시 충돌 구현” 관련 질문에서는 해시 테이블에서 LinkedList를 사용하는 이유에 대해 설명하고 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

뎅뚠

작성한 질문수

전체 Q&A

질문하기