BEST

실전 데이터 사이언스 Part2. 데이터 전처리

현업 실전에서 데이터 탐색 (EDA), 데이터 클리닝, 스케일링, 이상치 처리, 로그변환, 카테고리 인코딩 등이 왜 필요한지 그리고 어떻게 다루어야 하는지를 배웁니다. 또한 테이블 데이터 합치기, (비정형) 시계열 데이터 처리 방법을 배웁니다.

(4.7) 수강평 18개

수강생 236명

난이도 초급

수강기한 무제한

김화종

Python

질문

고민있어요

스터디

미해결
결측값 처리
<s
결측치
python
rlawodus522
・
2022. 05. 09.
0
559
1
미해결
n_step 값에 대하여
안녕하세요. n_step값에 대해 설명해 주 셨을때 과거 n일치 기온 데이터를 사용하여 내일 기온을 예측한다고 하셨습니다. 강의에서 본거처럼 n_step을 줄이면 큰 차이는 없지만 n_step을 계속올리고 300, 500, 700하면 R^2
python
피카라이언
・
2021. 07. 15.
0
440
1
미해결
dir*.csv가 안됩니다.
안녕하세요. 주피터 노트북으로 In[48] 부분에서 각각 별도의 csv로 장하는걸 보고 싶은데 <pre style="box-sizing: border-box; overflow: auto; font-size: 14px; padding
python
피카라이언
・
2021. 07. 13.
0
312
1
미해결
6 시그마 이상 outlier
안녕하세요. 6 시그마 이상인 값들은 이상치에 해당되는 샘플이라고 하셨는데 그 이유를 알 수있을까요? 수학적이라던지 아니면 통계학적으로라던지 근거를 알 수 있을까요?
outlier
python
이상치
피카라이언
・
2021. 07. 12.
0
544
1
미해결
로그변환에 대하여
안녕하세요. 로그변환에 대하여 궁금한게 있어 질문 남겨봅니다. 로그 변환을 한 데이터들이 모델이 학습해서 예측하기 좋아서 변환 시켜주는건가요? 로그변환을 안한 데이터를 학습하는거랑 accuracy/precision/f1 score등 차이가
로그변화
python
데이터분석
피카라이언
・
2021. 07. 12.
0
630
1
미해결
In[42] 14:50 코드 질문
<div class="type-placehol
code
python
피카라이언
・
2021. 07. 12.
0
240
1
미해결
Titanic 데이터셋 PClass cateogrical -> one hot encoding
안녕하세요 선생님. 원핫 인코딩을 categorical data에서 무조건 사용하나요? 만약에 categorical data가 숫자가 아닌 문자(alphabet)이면 당연히 컴퓨터가 못이해하니 변환시켜주는건 맞다고 생각하는데
타이타닉
python
데이터변환
실습
피카라이언
・
2021. 07. 11.
0
375
1
미해결
표준 스케일링관련 문의
표준 스케일링에 대해 설명해주시는 과정에서 표준 스케일링이 곧 정규분포로의 변환을 의미하는건 아니라는 말씀을 주셨는데,통계적 지식이 충분하지 않다보니 그 부분이 잘 이해가 되지 않아서 문의드립니다. 표준스케일링 작업을 거칠 경우, 평균이 0, 분산이
데이터전처리
python
표준스케일링
표준화
정규분포
정희연
・
2021. 07. 11.
0
302
1
미해결
6:14초 dataframe 스케일링한 후 컬럼 추가에 대한 질문
안녕하세요. 주피터노트북으로 따라하던 도중 에러가 났는데 어떻게 고칠줄 몰라 여쭈어봅니다. 37줄을 프린트하면 Key error가 납니다. # 키, 몸무게 데이터를 각각 표준 스케일링한 후 컬럼에 추가 <
dataframe
데이터전처리
python
피카라이언
・
2021. 07. 10.
0
733
1