4분 drop_duplicates 질문드립니다

Question

혼자서 데이터를 파헤쳐보며 연습하고 있는데요, keep='last'조건을 주신거에대한 반례가 있는것 같아서 질문드립니다. 다음과 같이 US는 굉장히 많은 iso2들이 있습니다. 이 경우는 운좋게 keep='last' 적용했을 때 US로 출력됩니다. 하지만 이 경우에는 덴마크에 대한 iso2(아마 지역구 별로 다르게 입력됐었던 것 같습니다) 는 덴마크의 keep='last'로 다뤘을때 옳은 값인 DK가 아닌 GL로 출력되게 되는데요. 이런 현상에 대해서 전체적으로 keep='last'를 적용하는게 맞나 싶어서 질문드립니다!

잔재미코딩 DaveLee · Answer

음 우선은 직접 작성해보신 것이니까요. 제가 전체 코드까지는 잘 모르겠지만, keep='first'가 default 이며, 중복값이 있으면 첫번째 값을 keep='last'는 그 반대로 마지막값을 선택한다고, 영상에서 설명을 드렸을 것이고, 해당 기능에 맞게 동작한 것으로 이해가 됩니다. 다음 실제 각 함수의 기능에 대해서도 확인을 해보신다면 좀더 이해가 가실 것 같고, 사실 영상에서도 역시 유사하게 설명을 드려서, 다시 한번 관련 기능에 대해서 영상을 보셔도 괜찮을 것 같은데, 어떠신가요? https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.drop_duplicates.html