인프런 커뮤니티 질문&답변
결정트리 수정버전 실습 질문
작성
·
91
0
결정트리 실습 수정버전 공부하던 중 궁금한 점이 있어 질문 올렸습니다.
feature_dup_df = pd.DataFrame(data=aa.groupby('column_name').cumcount(), columns=['dup_cnt'])
feature_dup_df = feature_dup_df.reset_index()을 보면,
1) 첫째줄: feature_dup_df 은 dup_cnt 1열의 dataframe을 나타내는 것이 맞나요?
2) 둘째줄:feature_dup_df을 reset_index()하는 이유를 모르겠습니다.
최종output(표)으로부터 pd.merge(aa.reset_index(), feature_dup_df, how='outer')을 분석해보면
aa.reset_index()을 받아
index(굵은 숫자316~), reset_index에 의한 index열(316~), column_name가 나왔고
feature_dup_df을 받아
dup_cnt 값이 나온걸로 이해했습니다. 그렇다면 굳이 feature_dup_df.reset_index() 할 필요 없는거 아닌가요?
3)how'outer'가 뭔지 잘 모르겠습니다.
감사합니다.
답변
답변을 기다리고 있는 질문이에요
첫번째 답변을 남겨보세요!




