작성
·
163
0
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
코드 내에서 값이 같은 경우 append를 하고
indexA += 1, indexB += 1을 해주셨는데
그럼 테이블B에 id가 중복된 경우 해당 행을 조인하지 못하고 건너뛰는 상황이 발생하지 않나요?
예를 들어 A의 id가 1, 2, 3, 4, 5이고
B의 id가 3, 3, 6, 7 이라고 하면
조인의 결과가 2행이 나와야 하는데
indexA = 2 indexB = 0 에서 매칭 후
바로 둘다 indexA = 3, indexB = 1이 되면
조인의 결과가 1행만 나올 것 같아요
답변 1
0
안녕하세요 ㅎㅎ
그럼 테이블B에 id가 중복된 경우 해당 행을 조인하지 못하고 건너뛰는 상황이 발생하지 않나요?
>> 네 맞습니다. 해당 실습 코드의 경우 id가 유니크한 경우를 기반으로 만들었습니다.
만약에 qn님이 생각하신 반례를 처리하는 코드를 만든다면 다음과 같이 만드시면 됩니다.
tableA = [{'id': 1, 'value': 'A1'}, {'id': 2, 'value': 'A2'}, {'id': 3, 'value': 'A3'}]
tableB = [{'id': 2, 'name': 'B2'}, {'id': 2, 'name': 'B3'}, {'id': 2, 'name': 'B4'}]
# 먼저 두 리스트를 'id'를 기준으로 정렬합니다.
sorted_tableA = sorted(tableA, key=lambda x: x['id'])
sorted_tableB = sorted(tableB, key=lambda x: x['id'])
joined_table = []
indexA, indexB = 0, 0
while indexA < len(sorted_tableA):
rowA = sorted_tableA[indexA]
temp_indexB = indexB # 임시 인덱스
while temp_indexB < len(sorted_tableB) and sorted_tableB[temp_indexB]['id'] <= rowA['id']:
rowB = sorted_tableB[temp_indexB]
if rowA['id'] == rowB['id']:
joined_row = rowA.copy()
joined_row.update(rowB)
joined_table.append(joined_row)
temp_indexB += 1
indexA += 1 # 다음 rowA로 이동
# ID가 더 작은 rowB를 건너뛰기 위해 indexB를 업데이트
while indexB < len(sorted_tableB) and sorted_tableB[indexB]['id'] < rowA['id']:
indexB += 1
# 결과 출력
for row in joined_table:
print(row)
위 코드도 괜찮지만 정렬병합조인 설명하기에는 제가 설명했던 코드가 더 단순 + 설명하기 쉽기 때문에 해당 예제 코드를 사용했습니다.
또 질문 있으시면 언제든지 질문 부탁드립니다.
좋은 수강평과 별점 5점은 제게 큰 힘이 됩니다. :)
감사합니다.
강사 큰돌 올림.