inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

실무 활용 SQL 데이터 분석: 효율적인 데이터 처리와 인사이트 도출

12_2. 프로젝트 1: 오픈에어비앤비 소개

12-2 listing 로드 문제

83

csd8850

작성한 질문수 2

0

load할 때 id에 중복값이 있어서 고유키 설정인 안되는데 어떻게 해결하나요

sql mysql dbms/rdbms

답변 2

0

DataScienceOne

안녕하세요 질문 감사드립니다.

옵션1. 중복되는 레코드를 드랍하기

옵션2. 테이블 설정에서 고유 id 중복 허용

 

1. 중복 레코드 삭제 (DROP)

중복된 데이터를 제거한 후 로드하는 방법입니다.

① 중복된 레코드 삭제 (DELETE + ROW_NUMBER())

MySQL 8.0 이상에서는 ROW_NUMBER()를 활용하여 중복된 행을 삭제할 수 있습니다.

WITH cte AS ( SELECT id, ROW_NUMBER() OVER (PARTITION BY duplicate_column ORDER BY id) AS row_num FROM table_name ) DELETE FROM table_name WHERE id IN (SELECT id FROM cte WHERE row_num > 1);

  • duplicate_column 기준으로 중복을 그룹화

  • ROW_NUMBER()를 사용하여 첫 번째 행을 제외한 중복 행 삭제

 

2. 테이블 설정 변경 (중복 허용)

중복을 허용하려면 기본 키 또는 제약 조건을 변경해야 합니다.

① 기본 키 제거 (PK 제거 후 중복 허용)

ALTER TABLE table_name DROP PRIMARY KEY;

주의: 기본 키를 제거하면 데이터 무결성 문제가 발생할 수 있음

INSERT IGNORE 사용 (중복된 데이터 무시)

INSERT IGNORE INTO table_name (id, column1, column2) VALUES (1, 'data1', 'data2');

  • 중복된 id 값이 있으면 해당 행을 무시하고 에러 없이 계속 실행

ON DUPLICATE KEY UPDATE 사용 (중복 시 업데이트)

INSERT INTO table_name (id, column1, column2) VALUES (1, 'data1', 'data2') ON DUPLICATE KEY UPDATE column1 = VALUES(column1), column2 = VALUES(column2);

  • 중복된 id 값이 있으면 기존 데이터를 업데이트

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. csd8850님.

SQL 데이터 로딩 중 중복된 기본 키 문제는 데이터베이스 관리에 있어 흔히 발생할 수 있는 이슈입니다. 데이터베이스에 데이터를 로드할 때 id 필드에 중복 값이 있어서 고유 키 제약 조건을 설정할 수 없을 때, 몇 가지 해결 방안을 제안드립니다:

  1. 초기 데이터 클리닝: 데이터 로딩 전에, 중복된 id를 제거하거나 통합하여 고유한 값을 가지도록 데이터셋을 정리합니다. 이는 데이터 품질을 높이는 데 중점을 둔 방법입니다.

  2. 고유한 식별자 생성: 데이터에 고유한 식별자를 생성하여 추가하는 방법입니다. 예를 들어, 기존 id를 수용하지 못하는 경우, 새로운 열을 생성하여 UUID 또는 다른 고유 식별자로 채워 넣을 수 있습니다.

  3. Conflict Handling: PostgreSQL 등의 데이터베이스에서는 INSERT ON CONFLICT 문을 사용하거나, MySQL에서는 INSERT IGNORE와 같이 중복된 항목을 무시하도록 설정할 수 있습니다.

관련된 기존 질문 답변을 참고하시면, 보다 구체적인 해결 방법과 쿼리를 작성하는데 도움이 될 것입니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

수업에서 사용하는 툴 질문드려요

0

13

2

2강에 파일 어디있을까여,,

0

12

2

다음 강의는 언제쯤 나올까요?

0

18

1

땃지님 실습소 DB서버 확인 부탁드립니다

0

18

1

강의자료 문의

0

18

1

마인드맵 사용 프로그램

0

19

1

엔터티 종류

0

21

2

제 3 정규형 vs BCNF 정규형 차이점?

0

26

2

XAMPP에서 Apache, DB 재기동 시 접속안되는 문제

0

16

1

DESC, ASC

0

26

2

수파베이스 ORM 질문

0

26

2

GROUP BY 시 인덱스를 타지 않는 이유가 궁금합니다

0

21

1

FOREIGN KEY 정리하기, 영상대로 SQL코드 복붙해도 안되요.

0

19

1

모델 서빙과 관련된 강좌 출시 예정된 바가 있으신지 여쭤봅니다!

0

29

2

트리거 질문

0

26

1

Vercel 실행이 안됩니다

0

24

1

패키지 구분에 대해 궁금한게 있습니다

0

25

2

노션 링크도 안 열리고, 알려준 vercel도 실행이 안됩니다.

0

25

1

Substack 1년 제공

1

32

3

특별 학습 자료 프로모션 1년 멤버십 무료 제공 문의드립니다

0

33

2

스프링부트 서버 에러나요

0

26

1

2-2. 실습 2A 6, 7번 문제

0

76

1

12_5 질문3

0

94

3

12_6강 질문

0

101

2