소개
Microsoft MVP(Python Developer Technologies)
네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자
서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,
한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의
다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석
20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험
강의
전체6로드맵
전체1수강평
- 흥미로운 주제로 강의 해주심에 감사합니다.
개foot
2024.07.09
0
- 자세하게 알려주셔서 감사합니다.
개foot
2024.07.09
0
- 증권 데이터 수집,전처리, 지표, 시각화 배우는 유용한 수업이었습니다.
shbw73
2024.06.28
0
게시글
질문&답변
2024.07.21
시각화 라이브러리 비교
안녕하세요. 해당 강의에서는 matplotlib, seaborn, pandas 를 사용합니다. 증권데이터 분석 강의에서는 해당 라이브러리와 plotly express 를 사용하는데 두 계열의 라이브러리는 정적 vs 동적 라이브러리로 비교할 수 있습니다. matplotlib 계열의 라이브러리는 이미지로 렌더링이 됩니다. plotly는 자바스크립트로 동적인 라이브러리 입니다. 이 외에도 파이썬에는 다양한 시각화 라이브러리가 존재합니다. matplotlib 이 가장 사용자가 많고 seaborn 은 통계적 연산과 미려한 시각화 등으로 해당 라이브러리를 해당 강의에서 선택했습니다. 다음 URL에서 파이썬의 다양한 시각화 라이브러리를 볼 수 있습니다. https://pyviz.org/overviews/index.html 해당 강의에서 matplotlib 을 사용한 이유라면 사용자가 가장 많고 이미지 형태로 볼 수 있다는 부분일거 같고요. plotly는 자바스크립트로 렌더링 하기 때문에 주피터 노트북이나 코랩등의 IPython 환경에서는 다시 렌더링이 필요하다든지의 이슈가 있습니다. 다 장점과 단점이 있는 도구로 특별히 선택한 이유라면 사용자가 가장 많고 널리 쓰이는 라이브러리라서 선택하게 되었습니다. 파이썬의 시각화 라이브러리는 미려함을 표현할 수 있어서인지 판다스나 넘파이처럼 사용자들이 특정 라이브러리에 수렴되기 보다는 다양한 시각화 도구들이 계속 등장하는 것 같습니다. (사진)pyviz 에 있는 시각화 도구의 종류입니다. 각자 역할과 장단점이 있어 비교해 보고 사용해 보셔도 좋겠습니다.
- 0
- 2
- 44
질문&답변
2024.07.21
에러 메시지
안녕하세요. seaborn 의 버전이 업데이트 되면서 데이터프레임의 인덱스가 겹치는 경우에 해당 메시지가 출력되고 있습니다. 해당 코드 바로 윗줄에 다음의 코드를 추가하고 df = df.reset_index(drop=True).copy() 다시 해당 그래프를 실행해 보세요. 조만간 해당 강의를 라이브러리 최신 버전에 맞춰 업데이트를 진행할 예정입니다. 감사합니다.
- 0
- 2
- 42
질문&답변
2024.07.21
그래프 색이 동일하게 나옵니다.
안녕하세요. 버전별로 사용하는 스타일이 달라져서 그래프 색이 다르게 나옵니다. 아래 AI인턴의 답변 처럼 plt.style .use('ggplot') 을 통해 특정 스타일을 사용하거나 파레트를 지정할 수 있습니다. 이 때 스타일에는 폰트가 포함되어 있는 것들이 있습니다. 또 여러 스타일을 복잡하게 만들기 때문에 원하지 않는 스타일로 지정이 되기도 하는데 폰트가 깨지는 문제가 발생할 수 있습니다. 폰트가 깨진다면 스타일 지정후 폰트를 다시 불러오거나 노트북을 새로 시작하는 방법을 추천해요. Seaborn 스타일 문서: https://seaborn.pydata.org/tutorial/aesthetics.html 이 문서에서는 Seaborn의 그림 미학을 제어하는 방법에 대해 자세히 설명하고 있습니다. 여기에는 다양한 스타일 프리셋 (darkgrid, whitegrid, dark, white, ticks)의 사용법과 커스터마이징 방법이 포함되어 있습니다. Matplotlib 스타일 문서: https://matplotlib.org/stable/tutorials/introductory/customizing.html 이 링크는 Matplotlib의 스타일 및 커스터마이징에 관한 공식 튜토리얼 페이지입니다. Matplotlib의 다양한 스타일 시트 사용법과 rcParams를 통한 세부 조정 방법을 설명하고 있습니다. 원하지 않는 폰트 제거 방법은 다음과 같습니다. 아래 방법으로도 안 된다면 해당 스타일을 지우고 가장 간단한 방법은 노트북을 새로 시작 하는 것을 추천합니다. 공식문서를 참고해서 더양한 스타일을 사용해 보세요. # 현재 rc 파라미터 가져오기 plt_params = plt.rcParams.copy() # 폰트 관련 설정 제거 font_params = [param for param in plt_params if 'font' in param] for param in font_params: plt.rcParams[param] = plt_params[param]
- 0
- 2
- 47
질문&답변
2024.07.13
강의에서 사용하는 csv 파일이 없습니다
안녕하세요. 답변을 기다리셨을텐데 늦어져서 죄송합니다. 실습 파일이 있는 data 폴더에 csv 파일을 추가해 두었습니다. (사진) 즐거운 주말 되세요! 감사합니다 :)
- 0
- 2
- 53
질문&답변
2024.07.04
적합한 알고리즘이나 라이브러리를 알고싶습니다
안녕하세요. 최근 랭체인 등의 툴을 사용하면 다양한 LLM의 API를 사용해 볼 수 있는데 20가지 분류 모델을 만드는 프롬프트를 작성해서 분류하는게 더 효율적일 수도 있습니다. 아니면 수업에서 소개하는 허깅페이스의 모델을 활용해서 분류해 보는게 어떨지 싶습니다. 화이팅 입니다 :)
- 0
- 1
- 83