Khoa học dữ liệu thực tế Phần 2. Tiền xử lý dữ liệu
Tìm hiểu lý do tại sao việc khám phá dữ liệu (EDA), làm sạch dữ liệu, chia tỷ lệ, xử lý ngoại lệ, chuyển đổi nhật ký, mã hóa danh mục, v.v. là cần thiết và cách xử lý chúng trong thực tế thực tế. Bạn cũng sẽ tìm hiểu cách hợp nhất dữ liệu bảng và xử lý dữ liệu chuỗi thời gian (không có cấu trúc).
- Chưa giải quyết
결측값 처리
<s
결측치pythonrlawodus5220550
・
0
537
1
- Chưa giải quyết
n_step 값에 대하여
안녕하세요. n_step값에 대해 설명해 주 셨을때 과거 n일치 기온 데이터를 사용하여 내일 기온을 예측한다고 하셨습니다. 강의에서 본거처럼 n_step을 줄이면 큰 차이는 없지만 n_step을 계속올리고 300, 500, 700하면 R^2
pythondonggeunko2496
・
0
425
1
- Chưa giải quyết
dir*.csv가 안됩니다.
안녕하세요. 주피터 노트북으로 In[48] 부분에서 각각 별도의 csv로 장하는걸 보고 싶은데 <pre style="box-sizing: border-box; overflow: auto; font-size: 14px; padding
pythondonggeunko2496
・
0
296
1
- Chưa giải quyết
6 시그마 이상 outlier
안녕하세요. 6 시그마 이상인 값들은 이상치에 해당되는 샘플이라고 하셨는데 그 이유를 알 수있을까요? 수학적이라던지 아니면 통계학적으로라던지 근거를 알 수 있을까요?
outlierpython이상치donggeunko2496
・
0
522
1
- Chưa giải quyết
로그변환에 대하여
안녕하세요. 로그변환에 대하여 궁금한게 있어 질문 남겨봅니다. 로그 변환을 한 데이터들이 모델이 학습해서 예측하기 좋아서 변환 시켜주는건가요? 로그변환을 안한 데이터를 학습하는거랑 accuracy/precision/f1 score등 차이가
로그변화python데이터분석donggeunko2496
・
0
604
1
- Chưa giải quyết
In[42] 14:50 코드 질문
<div class="type-placehol
codepythondonggeunko2496
・
0
224
1
- Chưa giải quyết
Titanic 데이터셋 PClass cateogrical -> one hot encoding
안녕하세요 선생님. 원핫 인코딩을 categorical data에서 무조건 사용하나요? 만약에 categorical data가 숫자가 아닌 문자(alphabet)이면 당연히 컴퓨터가 못이해하니 변환시켜주는건 맞다고 생각하는데
타이타닉python데이터변환실습donggeunko2496
・
0
351
1
- Chưa giải quyết
표준 스케일링관련 문의
표준 스케일링에 대해 설명해주시는 과정에서 표준 스케일링이 곧 정규분포로의 변환을 의미하는건 아니라는 말씀을 주셨는데,통계적 지식이 충분하지 않다보니 그 부분이 잘 이해가 되지 않아서 문의드립니다. 표준스케일링 작업을 거칠 경우, 평균이 0, 분산이
데이터전처리python표준스케일링표준화정규분포heeyeon04031232
・
0
284
1
- Chưa giải quyết
6:14초 dataframe 스케일링한 후 컬럼 추가에 대한 질문
안녕하세요. 주피터노트북으로 따라하던 도중 에러가 났는데 어떻게 고칠줄 몰라 여쭈어봅니다. 37줄을 프린트하면 Key error가 납니다. # 키, 몸무게 데이터를 각각 표준 스케일링한 후 컬럼에 추가 <
dataframe데이터전처리pythondonggeunko2496
・
0
716
1

