강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

rjsdnr4님의 프로필 이미지
rjsdnr4

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

4.4 Random Forest 에러

작성

·

201

0



아래 코드를 입력하면 File b'./human_activity/features.txt' does not exist: b'./human_activity/features.txt'

에러가 나오는데요...왜 이런건지 궁금합니다.





import pandas as pd def get_human_dataset( ): # 각 데이터 파일들은 공백으로 분리되어 있으므로 read_csv에서 공백 문자를 sep으로 할당. feature_name_df = pd.read_csv('./human_activity/features.txt',sep='\s+', header=None,names=['column_index','column_name']) # 중복된 feature명을 새롭게 수정하는 get_new_feature_name_df()를 이용하여 새로운 feature명 DataFrame생성. new_feature_name_df = get_new_feature_name_df(feature_name_df) # DataFrame에 피처명을 컬럼으로 부여하기 위해 리스트 객체로 다시 변환 feature_name = new_feature_name_df.iloc[:, 1].values.tolist() # 학습 피처 데이터 셋과 테스트 피처 데이터을 DataFrame으로 로딩. 컬럼명은 feature_name 적용 X_train = pd.read_csv('./human_activity/train/X_train.txt',sep='\s+', names=feature_name ) X_test = pd.read_csv('./human_activity/test/X_test.txt',sep='\s+', names=feature_name) # 학습 레이블과 테스트 레이블 데이터을 DataFrame으로 로딩하고 컬럼명은 action으로 부여 y_train = pd.read_csv('./human_activity/train/y_train.txt',sep='\s+',header=None,names=['action']) y_test = pd.read_csv('./human_activity/test/y_test.txt',sep='\s+',header=None,names=['action']) # 로드된 학습/테스트용 DataFrame을 모두 반환 return X_train, X_test, y_train, y_test X_train, X_test, y_train, y_test = get_human_dataset()



답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

생성하신 주피터 노트북이 있는 디렉토리 밑으로 human_activity 서브디렉토리 밑에 features.txt 파일이 없어서 pd.read_csv()가 발생시키는 오류입니다. 해당 디렉토리에 features.txt를 옮겨놓으시면 될 것 입니다.

rjsdnr4님의 프로필 이미지
rjsdnr4

작성한 질문수

질문하기