dorddo님의 소개 - 인프런

dorddo

@dorddos2983

수강평 작성수

2

평균평점

4.5

소개글이 비어있어요

게시글

질문&답변
[pandas] 중복 제거 관련
해결할 것 같은데, 혹시 동일한 문제를 해결해야하시는 분은 참고하시기 바랍니다. import numpy as np#)numpy importimport pandas as pd#)pandas importdf = pd.read_csv("~/fileName.csv") #)csv 파일 load. ep1 = df['ep1'].dropna()#)불러온 csv파일 데이터프레임에서 ep1의 열의 값을 변수 ep1에 할당ep2 = df['ep2'].dropna()#)불러온 csv파일 데이터프레임에서 ep2의 열의 값을 변수 ep2에 할당ep1_ep2 = pd.concat([ep1,ep2])#)ep1과 ep2를 하나의 컬럼으로 결합하여 새로운 변수 ep1_ep2에 할당ep1_ep2_1 = ep1_ep2.drop_duplicates()#)ep1_ep2에 중복으로 겹치는 value를 제거한 후 새로운 변수 ep1_ep2_1에 할당len(ep1_ep2) - len(ep1_ep2_1)#)ep1_ep2의 value 갯수에서 ep1_ep_2_1 value 갯수를 빼줌 = ep1과 ep2 2개의 컬럼에서 중복되는 value의 갯수
0
3
556
질문&답변
[pandas] 중복 제거 관련
안녕하세요, 답변 감사합니다.말씀주신 방법으로 새로운 컬럼을 만들어서 작업해보았습니다.제가 의도한 것은 ep1과 ep2열의 전체 값을 비교하여 중복인 것을 제거하는 이었는데,답변해주신대로 작업을 하니 ep1과 ep2의 각각의 row가 같은지 아닌지를 비교하여 새로운 컬럼에Ture, False로 반환하였습니다.ep1열 전체의 값과 ep2 열 전체의 값을 비교하여 중복을 제거하는 방법은 어떻게 해야 할까요?
0
3
556