• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

Section2 연습문제

23.07.31 15:38 작성 조회수 176

0

안녕하세요? 연습문제1번을 똑같이 따라 했는데, 최종화면이 다르게 나오네요.

 

제가 어떤 부분을 실수한 걸까요?

 

TWBX 파일을 첨부 할 수 없어 스크린샷을 대신 첨부 합니다.

 

연습문제1.PNG

답변 2

·

답변을 작성해보세요.

0

csv파일을 올려보니 필드명이 중국어로 바뀌어서 나오더라고요. 그래서 excel로 다시 저장해서 올렸어요. 엑셀로 저장시에 데이터 소실되는 것을 미처 생각하지 못했습니다. 충분히 답변이 되었습니다. 감사합니다.

아하, 혹시 csv를 태블로 데스크탑에 올렸을 때 필드명이 깨져서 나온 것인가요? 제 컴퓨터에서(맥과 윈도우 모두) 시도해봤을 때에는 모두 괜찮았는데, 인코딩 쪽에서 문제가 있는지 체크해봐야겠네요. 고맙습니다

0

안녕하세요, 최정민입니다

 

스크린샷만 보고 판단하건데, 아마 데이터 결합 과정에서 조인의 방향이나 몇 가지를 체크해봐야할 것으로 보입니다. 지금 현재 보내주신 화면의 필터 선반에 지역(시군구 읍면동 등) 관련 필터가 전혀 없는데, 서울의 지도가 온전히 나오지 않은 것은 결합 과정에서 빠졌을 가능성이 있어 보이거든요

 

왼쪽 하단의 데이터 원본 탭을 눌러주시면 조인 과정을 진행했던 데이터 준비창으로 갈 수 있는데 그곳으로 가셔서 스크린샷을 한번 더 찍어주실 수 있을까요? 제가 확인하고 싶은 부분은 조인의 방향과 조인 시 활용한 키 필드입니다!

Join1.PNG요청하신 스샷 보내드립니다. 스샷1

Join2.PNG

요청하신 스샷 보내드립니다. 스샷2

추정되는 원인을 말씀드립니다. 워크북을 확인한 것이 아니기 때문에 100% 확실한 것은 아니지만 조금 의심스러운 부분이 보입니다

 

제가 학습자료로 나눠드린 파일은 서울_생활인구_20221225.CSV 파일인데, 올려주신 스크린샷을 보니 CSV가 아닌 엑셀 파일이 올라가 있습니다. 아마 원본으로 드린 CSV 파일을 로컬 PC에서 한 번 열어보신 것 같고, 열어보신 후 XLSX 형식으로 다시 저장하신 것으로 보입니다

 

원본으로 제공드린 CSV 파일에는 100만개 이상의 행이 들어가있기 때문에 이를 엑셀로 다시 저장하면 일부 데이터가 소실될 수 밖에 없습니다. 엑셀에서 저장할 수 있는 행의 한계가 그렇기 때문입니다

 

제가 이렇게 추정한 이유는 첫번째 보내주신 스크린샷의 연령대 필터에 NULL이 끼어있습니다. 이것은 원래 존재하면 안되는 값인데, 존재하고 있는 것으로 보아 일부 데이터가 소실된 것으로 추정하였습니다

 

연결 과정은 문제가 없어보입니다. 필드를 잘 지정하셨고, 조인의 방향 또한 문제 없습니다. 생활인구 콘텐츠 부분을 담당하고 있는 파일을 XLSX가 아닌 제가 원래 드렸던 CSV로 시도해보심이 어떨까요? 데이터 준비창 스샷에서 보이는 '연결' 옆에 '추가' 버튼을 누르시고 텍스트 파일 커넥터를 활용하시면 CSV 파일을 가져올 수 있습니다!

 

혹시 이와 같이 진행했는데도 문제가 여전히 남아있다면 꼭 다시 말씀 주십시오!