inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

결정트리 수정버전 실습 질문

91

김학래

작성한 질문수 2

0

결정트리 실습 수정버전 공부하던 중 궁금한 점이 있어 질문 올렸습니다.
위 그림에서 밑줄 친 def 구문 첫 두 줄
feature_dup_df = pd.DataFrame(data=aa.groupby('column_name').cumcount(), columns=['dup_cnt'])
feature_dup_df = feature_dup_df.reset_index()을 보면,
 
 
1) 첫째줄: feature_dup_df 은 dup_cnt 1열의 dataframe을 나타내는 것이 맞나요?
 
 
2) 둘째줄:feature_dup_df을 reset_index()하는 이유를 모르겠습니다.
최종output(표)으로부터 pd.merge(aa.reset_index(), feature_dup_df, how='outer')을 분석해보면
aa.reset_index()을 받아
index(굵은 숫자316~), reset_index에 의한 index열(316~), column_name가 나왔고
 
feature_dup_df을 받아
dup_cnt 값이 나온걸로 이해했습니다. 그렇다면 굳이 feature_dup_df.reset_index() 할 필요 없는거 아닌가요?
 
3)how'outer'가 뭔지 잘 모르겠습니다.
 
감사합니다.
 

답변 0

오타 제보

2

34

2

시큐리티 필터 설정 질문입니다!

2

42

1

공통 코드 , 계층 구조 질문

1

37

1

강의 자료 위치

1

42

1