20.09.26 00:44 작성
·
311
2
안녕하세요 강의를보니 csv파일을 주피터노트북에서 실행하고그런건아닌가같은데..
죄송한데 제가이해가안되서그런데 그강사님이수업하시는걸 강사님이올려주신 깃허브에올라온 실습파일로똑같이따라하는건가요?
만약그게맞다면 데이터셋은 왜다운받았는지궁금합니다... csv파일이 주피터노트북에서 파일을 읽어올수있다는데... 저는 csv파일을 주피터노트북 저장폴더에넣고 주피터노트북에서 csv파일을눌러서실행하는식으로 실습하는건줄알았습니다... 강사님이 csv파일저장하시면서 csv다운받은파일을 한곳에모아두라고힌셨는데... 만약 이렇게클릭으로실행하는게아니라면 왜한파일에 모아두는건가요?
모아두는게 혹시 csv파일을주피터노트북에서 import함수로 불러오기시킨후 선생님강의를 따라하는식으로 해야하는건가요?
제가 파이썬기본문법까지하고 라이브러리익히려고 이강의수강중인데 주피터노트북이나 판다스같은 기본개념이 안잡혀서 햇갈리는거같습니다ㅜㅜ 죄송합니다ㅜㅜ
답변 3
1
1
2020. 09. 26. 10:58
안녕하세요.
수업을 진행하는데 어려움이 많으셨을거 같아요.
파일에 로드에 대한 도움이 더 필요할거 같아서 앞으로 해당 내용에 대한 강의 업데이트가 필요하다는 생각이 듭니다.
우선 그 전에 파일로드에 대해 설명을 드리면 주피터 노트북과 같은 경로에 파일을 옮겨두시면 이 파일을 클릭해서 불러오는 것보다 파이썬 프로그래밍을 통해 불러오게 됩니다.
코드에서 CSV 파일을 불러올 수가 있는데 다운로드 받는 이유는 그 CSV 파일의 주소를 작성해 주어야 하는데 온라인 상의 URL을 적어줄 수도 있지만 모든 CSV 파일이 온라인 상에 있지는 않을거에요.
내가 직접 수집한 데이터나 파일은 내 컴퓨터에 있을텐데 내 컴퓨터에 있는 파일을 가져오기 위해 다운로드를 받고 파이썬 코드를 사용합니다.
주피터 노트북에서 저는 data 라는 폴더에 두었어요. 일단 이렇게 주피터 노트북에 실습파일(.ipynb 확장자) 을 두면 해당 실습 파일에서 csv 확장자의 파일을 실습파일 노트북에서 불러올 수가 있습니다.
아래와 같이 실습 .ipynb 파일을 열어서 해당 파일에서 코드를 통해 불러오게 됩니다.
아래 코드는 파일을 로드하는 일부 코드이기 때문에 import pandas as pd 로 판다스를 로드하는 첫번째 줄 코드부터 순차적으로 실행해 주시면 파일이 로드가 됩니다.
실습파일과 CSV 파일을 한 곳에 모아두는 이유는 컴퓨터의 경로를 설정해 주어야 하는데 처음 실습할 때는 이 경로의 주소를 찾는걸 많이 어려워 하세요. 그래서 같은 경로에 있다면 파일 경로설정이 쉽기 때문에 같은 폴더에 두시는 걸 권장하고 있어요.
CSV파일은 클릭해서는 가져올 수가 없으며, 파이썬으로 만들어진 판다스 라이브러리를 활용해서 가져오는데 그걸 코딩을 통해 가져오게 됩니다.
그게 위에 있는 코드입니다. 또, 해당 코드를 로드하는 것만으로는 로드가 안 되고 반드시 코드를 순차적으로 실행해 주셔야 합니다.
어려움이 있으시면 또 질문주세요.
0