[pandas] 중복 제거 관련
584
2 asked
안녕하세요, 강의를 듣는 수강생입니다.
강의 잘 듣고 있습니다.
중복 제거 관련 질문이 있습니다.
결론적으로
- ep.1과 ep.2 열 데이터를 서로 비교하여 중복된 값을 제거하고
- ep.1과 ep.2 열 데이터를 서로 비교하여 제거된 중복된 데이터의 갯수를 알고 싶습니다.
'pandas 중복 제거' 라는 키워드로 검색해보아도
하나의 열을 기준으로 중복 데이터를 제거하는 방법만 나와있고,
다중 열을 기준으로 데이터를 제거하는 방법은 나와있지 않아 질문을 남깁니다.
![]()
Answer 3
0
해결할 것 같은데, 혹시 동일한 문제를 해결해야하시는 분은 참고하시기 바랍니다.
import numpy as np#)numpy import
import pandas as pd
#)pandas import
df = pd.read_csv("~/fileName.csv")
#)csv 파일 load.
ep1 = df['ep1'].dropna()
#)불러온 csv파일 데이터프레임에서 ep1의 열의 값을 변수 ep1에 할당
ep2 = df['ep2'].dropna()
#)불러온 csv파일 데이터프레임에서 ep2의 열의 값을 변수 ep2에 할당
ep1_ep2 = pd.concat([ep1,ep2])
#)ep1과 ep2를 하나의 컬럼으로 결합하여 새로운 변수 ep1_ep2에 할당
ep1_ep2_1 = ep1_ep2.drop_duplicates()
#)ep1_ep2에 중복으로 겹치는 value를 제거한 후 새로운 변수 ep1_ep2_1에 할당
len(ep1_ep2) - len(ep1_ep2_1)
#)ep1_ep2의 value 갯수에서 ep1_ep_2_1 value 갯수를 빼줌 = ep1과 ep2 2개의 컬럼에서 중복되는 value의 갯수
0
안녕하세요, 답변 감사합니다.
말씀주신 방법으로 새로운 컬럼을 만들어서 작업해보았습니다.
제가 의도한 것은 ep1과 ep2열의 전체 값을 비교하여 중복인 것을 제거하는 이었는데,
답변해주신대로 작업을 하니 ep1과 ep2의 각각의 row가 같은지 아닌지를 비교하여 새로운 컬럼에
Ture, False로 반환하였습니다.
ep1열 전체의 값과 ep2 열 전체의 값을 비교하여 중복을 제거하는 방법은 어떻게 해야 할까요?
0
열끼리 비교를 말하시는 거죠?
그럴경우
df["ep_1"] == df["ep__2"] == 1
이런식으로 새로운 컬럼을 만들어서 해당 컬럼이 TRUE인 값들만 제거해주는 방법이 있습니다.
environment setup - windows 사용자는 어떻게
0
214
0
Chapter 10에 대한 강의안이 없는것 같습니다.
0
287
0
이게 이렇게 어려운 이유가 뭐죠?
0
231
0
Python 코드 실행을 위한 코드 다운로드 관련
0
252
1
matrix product문제 질문 드립니다.
0
222
0
강의자료중 코드는 다운로드 안 되나요?
0
192
0
scikit-learn preprocessing 할때 Data Frame object has no attribute 'as matrix'라는 오류가 뜹니다
0
351
1
pdf 강의자료 다운로드 관련
0
214
1
과제 제출 시 위 에러가 나옵니다. 어떻게 해야 하나요?
0
228
1
Gradient Boosting에서 Light GBM, XGBOOST
0
331
1
np.where 값 리턴
0
304
1
숙제 제출 오류
0
218
1
다른분들이 짠 코드를 볼수있을까요?
0
205
1
house data 전처리 코드 관련 질문
0
683
1
설치이후 Pandas import 문제
0
1629
2
import sklearn import preprocessing 부터 에러가 납니다.
0
389
2
엑셀 파일 생성이 안됩니다.
0
489
2
딥러닝 강좌 관련해서 질문올립니다.
0
214
1
ch11 강의 코드
0
216
0
코드를 볼수 가 없어요
0
272
0
소스코드
0
170
1
질문있습니다
0
148
1
deactivate 가 되지 않는 경우
0
253
1
kaggle_titanic_pclass one-hot encoding에 대해 질문드립니다.
0
160
0

