Hỏi & Đáp
[pandas] 중복 제거 관련
해결할 것 같은데, 혹시 동일한 문제를 해결해야하시는 분은 참고하시기 바랍니다. import numpy as np #)numpy import import pandas as pd #)pandas import df = pd.read_csv("~/fileName.csv") #)csv 파일 load. ep1 = df['ep1'].dropna() #)불러온 csv파일 데이터프레임에서 ep1의 열의 값을 변수 ep1에 할당 ep2 = df['ep2'].dropna() #)불러온 csv파일 데이터프레임에서 ep2의 열의 값을 변수 ep2에 할당 ep1_ep2 = pd.concat([ep1,ep2]) #)ep1과 ep2를 하나의 컬럼으로 결합하여 새로운 변수 ep1_ep2에 할당 ep1_ep2_1 = ep1_ep2.drop_duplicates() #)ep1_ep2에 중복으로 겹치는 value를 제거한 후 새로운 변수 ep1_ep2_1에 할당 len(ep1_ep2) - len(ep1_ep2_1) #)ep1_ep2의 value 갯수에서 ep1_ep_2_1 value 갯수를 빼줌 = ep1과 ep2 2개의 컬럼에서 중복되는 value의 갯수
- Lượt thích
- 0
- Số bình luận
- 3
- Lượt xem
- 592

