소개
Microsoft MVP(Python Developer Technologies)
네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자
서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,
한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의
다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석
20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험
강의
로드맵
전체 1수강평
게시글
질문&답변
안녕하세요 데이터 최신과 관련해서 문의드립니다.
안녕하세요. 해당 방법은 df.melt 라는 방법으로 사용합니다. 강의에 보면 2015년 이전 데이터를 이 방으로 녹이는 예제가 있으니 참고해 보세요.그리고 다음 주소에 해당 데이터가 주기적으로 업데이트 되니 확인해 보세요!https://kosis.kr/statHtml/statHtml.do?orgId=414&tblId=DT_41401N_005&conn_path=I2
- 0
- 3
- 16
질문&답변
한글폰트 관련해서 문의드립니다.
안녕하세요. 아래 AI가 답변한 것처럼 폰트 설정을 직접 해주시는 방법도 있습니다. # 이를 통해 matplotlib의 기본 폰트를 설정 plt.rc("font", family="NanumBarunGothic") 설치를 했는데도 여전히 폰트가 깨질때는 경로를 제대로 못 가져왔을 가능성이 큽니다.설치한 곳이 주피터 노트북의 해당 가상환경이 맞는지 확인이 필요하며,주피터 노트북이 해당 가상환경에서 실행되고 있는지에 대해서도 확인이 필요합니다.
- 0
- 2
- 8
질문&답변
scatterplot질문
안녕하세요.질문해 주신 것처럼 두 가지 방법 모두 동작합니다. 데이터가 크지 않다면 어떤 방법으로 사용해도 큰 차이는 없습니다. 다만, 컬럼이 너무 많거나 할 때 인덱싱을 하고 시각화를 하게 되면 속도도 빠르고 직관적으로 사용하실 수 있습니다.감사합니다 :)
- 0
- 1
- 25
질문&답변
모두의 한국어 텍스트 분석과 자연어처리 with 파이썬 -> 섹션 3 부터 재생이 안됩니다.
안녕하세요.이용에 불편을 드려 죄송합니다. 제가 재생해 봤을때는 잘 나오는데 계속 재생이 안 된다면 다시 답글을 남겨주시거나 인프런 고객센터로 문의 부탁드립니다. 감사합니다.
- 0
- 1
- 11
질문&답변
데이터프레임 칼럼명 문의 드립니다.
(사진)# finance-datareader 가 설치되어 있지 않다면 설치 !pip install -Uq finance-datareader import FinanceDataReader as fdr # 한국거래소 상장종목 전체 df_krx = fdr.StockListing('KRX') df_krx.head() 안녕하세요.위와 같이 FinanceDataReader를 통해 데이터를 불러와서 분석하실 수 있습니다.다만, 데이터의 형태가 달라져서 변경된 내용으로 분석을 진행하실 수 있습니다.앞으로도 다른 데이터에 적용을 해보기위해서는 새로운 데이터를 분석해 보는 연습을 해보면 좋으니 해당 데이터에 적용해 보시고 어려움이 있으시면 질문을 부탁드립니다.화이팅입니다 :)
- 0
- 3
- 45
질문&답변
데이터프레임 칼럼명 문의 드립니다.
안녕하세요. 라이브러리 업데이트로 강의 촬영당시와 컬럼명이 변경되어 불편을 드려 죄송합니다.해당 강의 자료에서 https://github.com/corazzon/finance-data-analysis/blob/main/krx.csv 의 csv 파일을 제공합니다. 해당 파일을 위 데이터를 불러오는 대신 다음의 코드로 불러와 실습을 하시면 촬영 화면과 같은 내용으로 실습해 보실 수 있습니다. import pandas as pd df_krx = pd.read_csv('https://raw.githubusercontent.com/corazzon/finance-data-analysis/refs/heads/main/krx.csv') df_krx감사합니다.
- 0
- 3
- 45
질문&답변
금융데이터 수집의 모든것
안녕하세요. 해당 라이브러리를 사용하고 있고, 또 해당 라이브러리의 튜토리얼을 다루기는 하지만 강의에서 모든 튜토리얼을 다루지는 않습니다.다른 튜토리얼에도 관심이 있으시다면 진행해 보시고 잘 안 되거나 하는 내용이 있을 때 질문 주시면 답변 드리겠습니다.감사합니다.
- 0
- 2
- 21
질문&답변
녹화시점과 현재시점 컬럼명이 변경이 많이 되었을까요?
안녕하세요.KRX 데이터로 전체 종목을 분석하는 초반부는 API의 컬럼이 많이 변경되었습니다.네이버 증권의 일별시세나 나머지 부분은 크게 변화된 부분이 없습니다.변경된 부분이 많은 KRX 전체종목에 대한 비교는 제공해 드리는 녹화 시점의 csv 파일을 통해 실습해 보실 수 있습니다.감사합니다.
- 0
- 2
- 44
질문&답변
0204 쇼핑 리뷰 군집화 - KMeans, Elbow, Silhouette 분석 강의 질문있습니다.
안녕하세요. 두 방법은 군집의 수를 선택하는데 도움이 됩니다.하지만 참고 지표일 뿐입니다. 현실세계에서 나누고자 하는 군집으로 잘 나뉘었는지, 여러 파라미터를 조정했을 때 해당 스코어가 어떻게 되는지를 모니터링 하면서 모델을 개선하는 지표로 활용해 보는 것을 추천합니다.
- 0
- 2
- 44
질문&답변
load_metric 에러 발생
안녕하세요. 가상환경 등의 설정에 따라 패키지가 다른 곳에 설치가 되었을거 같습니다.설치를 계속 해도 동작을 하지 않을 때는 패키지를 직접 다운로드 받아 옮겨주시는 방법을 추천합니다.다음은 질문주신 경로에 대한 ChatGPT의 응답 입니다. 해당 경로에 다운로드 받아 직접 옮겨보는 방법을 사용해 보세요. 아래 답변은 터미널로 옮기는 방법이 나와있지만 직접 파일탐색기 등을 통해 옮겨주시는 방법도 있습니다. 질문주신 경로 /usr/local/lib/python3.10/dist-packages/ 에서 datasets 이 설치된 것이 보여야 합니다. pip 로 설치가 안 될 때 아래 방법으로 직접 파일을 옮겨보세요. `ImportError: cannot import name 'load_metric' from 'datasets'` 오류가 발생할 때, 패키지를 직접 다운로드하여 문제를 해결하는 방법은 다음과 같습니다: ### 1. 필요한 패키지 버전 확인 오류가 발생하는 이유는 종종 패키지 버전이 호환되지 않거나 최신 버전이 아닌 경우입니다. `datasets` 패키지의 최신 버전을 사용하고 있는지 확인하세요. 특정 버전이 필요한 경우, 해당 버전을 확인해야 합니다. ### 2. 패키지 다운로드 패키지를 직접 다운로드하려면, PyPI(Python Package Index)에서 원하는 패키지를 찾을 수 있습니다. 예를 들어, `datasets` 패키지를 다운로드하려면: - [datasets 패키지 페이지](https://pypi.org/project/datasets/)로 이동합니다. - 해당 페이지에서 `.tar.gz` 파일 또는 `.whl` 파일을 다운로드합니다. ### 3. 다운로드한 패키지를 `/usr/local/lib/python3.10/dist-packages/` 경로로 옮기기 다운로드한 파일을 `/usr/local/lib/python3.10/dist-packages/` 경로로 옮깁니다. 1. **터미널 열기**: ```bash sudo cp /path/to/downloaded/package.whl /usr/local/lib/python3.10/dist-packages/ ``` 2. **패키지 설치**: 경로로 이동한 후 다음 명령어를 실행하여 패키지를 설치합니다. ```bash cd /usr/local/lib/python3.10/dist-packages/ sudo pip install package.whl ``` 또는, `.tar.gz` 파일인 경우: ```bash tar -xzvf package.tar.gz cd package-directory sudo python setup.py install ``` ### 4. `load_metric` 함수가 포함된지 확인 설치한 후에 `load_metric` 함수가 포함된 것을 확인하기 위해 다음과 같이 테스트해 보세요: ```python from datasets import load_metric metric = load_metric('accuracy') print(metric) ``` 이제 이 방법으로 오류를 해결할 수 있을 것입니다. 만약 여전히 문제가 발생한다면, 패키지의 다른 버전을 시도하거나, 의존성이 있는 다른 패키지들이 잘 설치되어 있는지 확인해야 합니다.
- 0
- 2
- 475