소개
Microsoft MVP(Python Developer Technologies)
네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자
서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,
한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의
다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석
20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험
강의
전체6로드맵
전체1수강평
- 좋은 강의 잘 들었습니다.
정병선
2024.03.26
1
- 잘봤습니다
taekjun_han
2024.03.11
1
- 좋은 강의 감사합니다
성진
2024.03.05
1
- 내용 유익하고 좋아요
dudqh0212
2024.03.01
1
- 데이터 전처리 과정에서 도움을 받았습니다.
Jinwoo Park
2024.02.27
1
게시글
질문&답변
2024.04.19
안녕하세요 선생님
안녕하세요. 텍스트 데이터 전처리(형태소 분석, 불용어 제거 등)를 진행하고 1) 빈도 분석을 해보는게 어떨지 싶습니다. 2) 토픽모델링을 하면 주요 주제별 키워드를 추출합니다. 3) 강의에 있는 텐서플로를 활용한 임베딩을 진행한 후 임베딩 프로젝터로 시각화 해서 가까운 의미의 키워드를 찾아보는 것도 좋겠습니다. 화이팅입니다 :)
- 0
- 1
- 45
질문&답변
2024.04.18
빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.
안녕하세요. 질문주신 내용처럼 value_counts() 결과의 인덱스 값과 데이터프레임의 인덱스 값이 다릅니다. 해당 결과는 빈도수 결과인 value_counts() 의 일부를 가져오는 것이라 해당 결과로 인덱싱을 해주어야 의도한 값을 가져올 수 있습니다. 감사합니다 :)
- 0
- 2
- 47
질문&답변
2024.04.18
hue를 사용할 때
안녕하세요. 범례 위치에 대한 질문을 주신것으로 보여집니다. plt.legend() 키워드로 찾아보면 범례 위치 조정 등에 대한 예시를 볼 수 있습니다. import matplotlib.pyplot as plt # 데이터 생성 x = [1, 2, 3, 4, 5] y1 = [2, 4, 6, 8, 10] y2 = [1, 3, 5, 7, 9] # 그래프 그리기 fig, ax = plt.subplots() ax.plot(x, y1, label='Line 1') ax.plot(x, y2, label='Line 2') # 범례를 그래프 바깥쪽에 표시하기 plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left', borderaxespad=0.) # 그래프 표시 plt.show() 다음은 claude.ai 로 작성한 위 코드에 대한 설명입니다. 이 코드에서는 plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left', borderaxespad=0.) 를 사용하여 범례를 그래프의 바깥쪽 왼쪽 상단에 표시합니다. bbox_to_anchor 는 범례의 위치를 지정하는 옵션입니다. 이 경우 (1.05, 1)은 그래프 영역의 오른쪽 경계에서 5% 떨어진 위치에 범례가 표시됩니다. loc='upper left' 는 범례 내부의 정렬 방식을 지정합니다. borderaxespad=0. 은 범례와 그래프 사이의 간격을 조정합니다. 이 기능에 대한 공식 문서는 다음 링크에서 확인할 수 있습니다: https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.legend.html
- 0
- 1
- 33
질문&답변
2024.04.09
주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요
해결되었다니 다행입니다 🙂 화이팅 입니다!
- 0
- 3
- 81
질문&답변
2024.03.22
corr = df.corr() 입력시 오류
안녕하세요. 해당 라이브러리가 업데이트가 되어 수치 데이터만 보는 옵션을 추가해 주셔야 합니다. # 각 변수의 상관계수를 구합니다. corr = df.corr(numeric_only=True) corr 위와 같이 numeric_only=True 를 작성해 주시면 동작합니다. 기존에는 수치데이터만 가져오는 것이 기본 설정이었는데 변경되었습니다. 감사합니다.
- 0
- 1
- 82