강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

김학래님의 프로필 이미지
김학래

작성한 질문수

결정트리 수정버전 실습 질문

작성

·

91

0

결정트리 실습 수정버전 공부하던 중 궁금한 점이 있어 질문 올렸습니다.
위 그림에서 밑줄 친 def 구문 첫 두 줄
feature_dup_df = pd.DataFrame(data=aa.groupby('column_name').cumcount(), columns=['dup_cnt'])
feature_dup_df = feature_dup_df.reset_index()을 보면,
 
 
1) 첫째줄: feature_dup_df 은 dup_cnt 1열의 dataframe을 나타내는 것이 맞나요?
 
 
2) 둘째줄:feature_dup_df을 reset_index()하는 이유를 모르겠습니다.
최종output(표)으로부터 pd.merge(aa.reset_index(), feature_dup_df, how='outer')을 분석해보면
aa.reset_index()을 받아
index(굵은 숫자316~), reset_index에 의한 index열(316~), column_name가 나왔고
 
feature_dup_df을 받아
dup_cnt 값이 나온걸로 이해했습니다. 그렇다면 굳이 feature_dup_df.reset_index() 할 필요 없는거 아닌가요?
 
3)how'outer'가 뭔지 잘 모르겠습니다.
 
감사합니다.
 

답변

답변을 기다리고 있는 질문이에요
첫번째 답변을 남겨보세요!
김학래님의 프로필 이미지
김학래

작성한 질문수

질문하기