inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]

자전거 공유 문제 이해와 EDA1

자전거 공유 문제 이해와 EDA1 에서 슬라이싱 관련 질문입니다

258

vpdtlrdl

작성한 질문수 45

0

자전거 공유 문제 이해와 EDA1 강의 11분 30초 부분에서

df_train = df_all[:10885]
df_test = df_all[10886:]

위와 같이 train, test 데이터를 분리하셨는데요

df_train 데이터프레임은 원래 10886개의 행, 즉 아래의 사진과 같이 구성되어 있었습니다.

캡처.PNG

반면,

df_train = df_all[:10885]

이와 같이 데이터프레임을 분리한 결과,

1.PNG총 10885 개의 행으로 줄어들면서 하나의 행이 빠진 모습을 보였습니다.

코드를 다음과 같이 수정하는 것이 맞는 것 같아서 질문 드립니다!

df_train = df_all[:10886]

 

 

 

 

 

 

 

 

 

 

kaggle 머신러닝 배워볼래요? pandas python

답변 1

1

잔재미코딩 DaveLee

안녕하세요. 답변도우미입니다.

아하 이야기하신 부분이 맞습니다. 실수네요. 죄송합니다. 슬라이싱 부분이 마지막이 -1로 처리하는 부분때문에, 실수하였네요. 10886 이 맞습니다. (그러면 인덱스로 0 ~ 10885 까지를 가져오게 되는 것이니까요~)

감사합니다.

자료 공유 질문

0

61

1

Ascii 에러 관련하여 질문드립니다

0

81

1

고차원 데이터 질문

0

58

1

세션4 범주형 데이터 분석 패턴 강의 질문

0

199

2

pandas 2.2.2, xgboost 2.1.3 에러 해결 방법

0

215

1

sklearn v1.5.1

0

168

1

머신러닝 적용을 위한 Feature Engineering 작업1

0

179

2

missingno 대체

0

169

1

scikit-learn 1.5.1 matplotlib 3.9.2

0

130

1

환불문의

0

264

1

자료공유를 받으려고 하는데 에러가 납니다.

0

158

1

iplot에서 항상 에러나는 분 안계신가용?

0

224

1

사망 여부 영향 가능성

0

142

1

섹션4_인코딩 이해하고 적용해보기(원핫인코딩) 질문

0

190

1

df.corr(numeric_only=True).iplot() 에러 해결 어떻게 해야되나요?

0

280

1

주피터 노트북 201_REGRESSION_BIKE_SHARING_MODELS 중 질문

0

245

1

3강 강의 자료 코드 관련 질문입니다

1

337

1

맥 사용자 mkdir .kaggle 했는데 파일이 안만들어집니다.

0

415

1

Bayesian Optimization에서 optimizer.maximize()함수를 더이상 지원 안한다고 합니다.

0

877

2

Bayesian Optimization LightGBM 적용

0

459

2

하이퍼 파라미터 튜닝 기법 적용하기 실행값이 미묘하게 달라요.

1

343

1

중복된 코드 수정 요청 - 자전거 공유 문제 이해와 EDA3

0

216

1

강의 중 에러 질문

0

741

1

cross_val_score 에러

0

464

1