질문있습니다
207
작성한 질문수 28
선생님 강의 정말 재밌게 잘 보고 있습니다!
concat을 이용해서 데이터 합치는 연습을 혼자서 해보고 있었는데
영상 속에서는 pd. concat([df1, df2])이런식으로 하면
알아서 인덱스도 1부터 매겨지고, 연도도 오름차순으로 정렬이 되었는데요
저는 혼자 따로해보니 연도가 들쑥 날쑥하고 인덱스 번호도 들쑥 날쑥합니다..
왜그런가 이것 저것 살펴보니
저는 pd.concat([df2, df1])처럼 순서를 앞뒤 바꾸어놨었네요
근데 이 순서에 따라 어떻게 결과값이 달라지는지 궁금해서 질문 올립니다!
답변 1
0
안녕하세요.
concat 의 기본값은 axis=0 으로 같은 컬럼의 이름끼리 행을 위아래로 붙입니다.
반대로 axis=1 이라면 인덱스값을 기준으로 컬럼을 옆으로 붙입니다.
이 때, 일관되게 값이 병합되게 하려면 기준이 되는 컬럼이나 인덱스 값이 같아야 합니다.
예를 들어 axis=0 으로 행끼리 붙여준다면 컬럼명이 같은 데이터를 행으로 붙여줍니다.
이때 컬럼명에 오타나 띄어쓰기 등으로 컬럼명이 약간이라도 다르다면 같은 컬럼으로 붙지 않습니다.
"컬럼 1", "컬럼1" 이 두 개의 컬럼은 같은 이름으로 보이지만 앞에 컬럼은 띄어쓰기가 들어 있기 때문에 다른 컬럼으로 인식하고 두 개의 컬럼을 생성하게 됩니다.
하지만 "컬럼1", "컬럼1" 과 같이 컬럼에 띄어쓰기나 눈에 보이지 않는 공백 등이 없다면 같은 컬럼에 데이터가 병합되게 됩니다.
아래 링크는 판다스 공식문서인데 concat 의 여러 예시가 있으니 꼭 참고해 보는 것을 추천합니다.
[Merge, join, concatenate and compare — pandas 1.3.4 documentation](https://pandas.pydata.org/docs/user_guide/merging.html)
패키지 설치 에러 ydata-profiling
0
121
2
자세한 설명 부탁드려요 ㅜ
0
177
2
seaborn 라이브러리 호출하였으나 그래프가 안 그려져요
0
288
2
value_counts와 count 차이
0
343
2
안녕하세요 데이터 최신과 관련해서 문의드립니다.
0
205
3
scatterplot질문
0
122
1
강의 화면이 안나옵니다
0
164
2
4분12초 2013년부터 데이터가 없으면 어떻게하나요?..
0
188
2
에러 메시지
1
303
2
그래프 색이 동일하게 나옵니다.
0
309
2
시각화 라이브러리 비교
0
384
2
주피터 노트북 설치
0
390
1
2. 상가 기술통계 아웃풋 자료에서 오류가 납니다
0
226
1
14. distplot g = sns.FacetGrid(df_last, row="지역명", height=1.7, aspect=4) g.map(sns.distplot, "평당분양가격", hist=False, rug=True); 오류
0
178
1
group by agg function failed 에러
0
687
2
빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.
0
288
2
주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요
0
363
3
get_string함수에서 문자 'nan'
0
200
1
seaborn X축 시작 지점 조정 질의의 건
0
213
1
14강 distplot 질의
0
289
1
nbextension 설치 및 셋팅 후 적용이 안되는 이슈
0
478
1
corr = df.corr() 입력시 오류
1
373
1
keyword grid_b is not recognized
0
336
1
%ls data 매직커맨드 사용시 한글 깨짐
0
293
1





