• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

자꾸 질문드려 죄송합니다 . 컬럼인덱스 이해가 안가네요..

20.10.16 21:44 작성 조회수 178

0

프로그램이 처음이라서 그런지 모든게 의문투성입니다.

어느덧 40이 넘은 나이지만, 퇴근후에 회사에 남아서, 

어려워도 포기하지 않고 몇번씩 돌려가며 연습하고있습니다. 

그래도 이해가 가지 않아 질문드려요

import json

import pandas as pd

with open('COVID-19-master/csse_covid_19_data/country_convert.json', 'r', encoding = 'utf-8-sig') as json_file:

    jons_data = json.load(json_file)

def country_name_convert(row):

    if row['Country_Region'] in json_data:

        return json_data[row['Country_Region']]

    return row['Country_Region']

def creat_dateframe(filename):

    

    doc = pd.read_csv('PATH + filename', encoding= 'utf-8-sig')

    try:    # 읽었는데 읽은 파일의 컬럼인덱스가 우리가 원하는 컬럼네임인지 확인해야돼, 아니면 바꿔줘야해서 try

        doc = doc[['Country_Region', 'Confirmed']]

    except:

        doc = doc[['Country/Region', 'Confirmed']]

        doc.columns = ['Country_Region', 'Confirmed']

    doc = doc.dropna(subset = ['Confirmed']) # 특정컬럼의 값이 없는 행을 삭제해버려

    doc['Country_Region'] = doc.apply(country_name_convert, axis =1)   #  국가명을 여러파일에 일관되게 변경하기

    doc = doc.astype({'Confirmed':'int64'})

    doc = groupby('Country_Region').sum()

    

    date_colum = filename.split('.')[0].lstrip('0').replace('-', '/')

    doc.columns = [date_column]

    return doc

  

 위의 코드에서

    date_colum = filename.split('.')[0].lstrip('0').replace('-', '/')

    doc.columns = [date_column]

  이 두줄은

  date_colum  => 컬럼명을 만들고

  doc.columns = [date_column]  => 컬럼을 지정한것으로 보입니다

  원래 doc의 컬럼은 'Country_Region', 'Confirmed' 이렇게 두개 였는데

doc.columns = [date_column] 이 코드로 인하여 1개의 컬럼이 되어진건가요?

그럼 자동으로 앞의 컬럼 Country_Region  이게 인덱스로 지정되어지는 건가요?

앞의 컬럼이 인덱스로 지정되는게 법칙일까요?

컬럼이 5개인데 1개로 줄인다면, 무조건 맨앞의 컬럼이 인덱스가 되는건가요?

맨처음에 맨앞에 있던 인덱스컬럼 0,1,2,3,4,5 이건 왜 없어졌을까요?

질문을 잘 전달드렸는지 모르겠네요. 질문이 너무 이상하다면. 답변보다

제가 찾아봐야할 강의 목차를 알려주시면 감사하겠습니다!

그럼 

많은 지도 부탁드리겠습니다

답변 1

답변을 작성해보세요.

1

안녕하세요. 죄송하지만, 질문이 너무 길고, 다양한 질문들이 있는듯해서, 무슨 이야기인지 알기가 어렵습니다.

추후에는 다음과 같은 공지사항과 마찬가지로, 이렇게 어려움이 느껴지실 수록, 질문하실 때, 정확히 영상 어느 부분인지, 표기해주시면 저뿐만 아니라, 수강생님께도 도움이 되실꺼예요. 40대라고 하셨는데, 저도 40대라서 ㅎㅎ 그 부분은 전혀 상관없습니다. 다만, IT를 따라오시는데 평균 이상을 넘는 어려움을 겪으시는 분들은, 대부분 영상에 설명한 부분을 그대로 물으시는 경우들이 많은데요. 이 경우, 이를 다시 글로 답변을 드린다고 해서, 영상으로 이해가 안가는 부분이 글로는 이해가 될리는 더욱 만무하거든요. 질문 하실 때, 어느 시점이 문제인지까지 표기를 한다면, 영상을 확실히 봐야 하니까, 그러면서 더 영상을 이해할 수 있고요. 영상 자체가 이해가 안가는 상황이 반복된다면, 그 때부터는 우선은 프로그래밍 전체가 이해가 안가는 것이니, 전체를 주피터 노트북을 손에서 떼시고, 영상만 쭉 끝까지 보시면서, 전반적인 맥락만 이해하려고 우선 노력하시는 것이 좋습니다. 감사합니다.

-----------

안녕하세요. 잔재미코딩 Dave Lee 입니다.

다음이 아니라, 질문시 한가지 꼭 확인부탁드리고자 공유드립니다.

질문하실 때 가능하다면, 어느 챕터 강의의 최소 몇 분 정도의 영상을 꼭좀 알려주시면 좋겠어서요.

제가 모든 영상을 분단위로 기억하기는 어려운데요.

이런 정보가 없는 질문에 대해 답변을 할 때는, 답변에 들이는 시간보다, 어떤 맥락에서 어느 영상의 어떤 코드에서 질문을 하시는 것인지를 찾는데 훨씬 시간이 많이 듭니다. 

그러다보니, 더 설명을 잘해드리기 어려울 때도 많거든요.

그래서, 꼭 좀 질문하실 때 가능하다면, 

어느 챕터 강의의 최소 몇 분 정도의 영상을 꼭좀 알려주시면 감사하겠습니다.

감사합니다.