해결된 질문
작성
·
43
·
수정됨
0
관련 내용:
강의: 55. 해시 알고리즘6 - 해시 충돌 구현
21:56
pdf: 6. 컬렉션 프레임워크 - 해시(Hash)
24P 정리 부분
해시 인덱스를 사용하는 경우 데이터 저장을 할 때 평균 시간복잡도가 O(1)
이라고 설명.
의문점
private static void add(LinkedList<Integer>[] buckets, int value) {
int hashIndex = hashIndex(value);
LinkedList<Integer> bucket = buckets[hashIndex]; //O(1)
if (!bucket.contains(value)) { //O(n)
bucket.add(value);
}
}
위와 같이 항상 bucket이 contains(..)
메서드를 호출하여 중복된 값이 있는지 확인하므로 O(n)의 시간 복잡도가 소요됩니다. 그래서 저는 항상 데이터 저장을 할 때는 O(n)으로 계산해야 한다고 생각했습니다.
강의에서 말씀하신 내용은 이상적으로 해시 충돌이 별로 발생하지 않는 상황(그리고 구체적인 구현은 신경쓰지 않는 상황)이라 가정하고 O(1)이라고 한 것일까요?
답변 2
0
자답
강의 해시 알고리즘6 - 해시 충돌 구현
15:02 부분에서 이미 설명한 내용.
데이터를 추가하는데 O(n)의 시간 복잡도가 소요.
그러나, 해시 충돌이 발생하지 않는 상황은 결국 각 bucket의 데이터가 0개나 1개 들어있는 거기때문에 contains(..)
가 O(1)의 시간 복잡도로 소요된다.
따라서, 해시 인덱스를 사용하는 경우 데이터 저장을 할 때 평균 시간 복잡도가 O(1)이라 할 수 있다.
괜한 알람가게 해서 죄송합니다.
0
안녕하세요, 인프런 AI 인턴입니다.
임형준님이 말씀하신 것처럼, 해시 테이블에서 데이터를 저장할 때 평균 시간 복잡도는 일반적으로 O(1)
로 간주됩니다. 이는 해시 충돌이 거의 발생하지 않는 이상적인 상황을 가정한 것입니다. 해시 테이블의 기본 아이디어는 데이터가 고르게 분산되어 각 버킷에 하나의 요소만 저장되도록 하는 것입니다. 이 경우 데이터 접근과 저장은 직접적으로 해당 인덱스로 접근하므로 O(1)
의 시간 복잡도를 갖습니다.
그러나, 실제 상황에서는 해시 충돌이 발생하고 여러 요소가 같은 버킷에 저장될 수 있습니다. 이 때는 contains()
를 사용하여 중복 여부를 확인해야 하므로, 특정 버킷 내부에서의 연산은 O(n)
이 될 수 있습니다. 이 때문에, 해시 테이블의 최악의 상황에서는 시간 복잡도가 O(n)
로 증가할 수 있습니다.
강의에서는 해시 테이블의 이론적 장점과 가장 이상적인 상황을 설명하신 것으로 보입니다. 실제로는 해시 함수의 설계가 얼마나 잘 되느냐에 따라 성능이 달라질 수 있습니다.
관련 질문을 더 깊이 이해하는 데 도움이 될 수 있는 게시물로 아래 링크를 참고하여 주세요:
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.