inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 파이썬 머신러닝 완벽 가이드

선생님 질문있습니다. 회귀 예측에서 새로운 테스트 데이터를 입력해서 어떻게 결과를 찾아내는 지 궁금합니다.

239

이해진

작성한 질문수 1

0

- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
 
안녕하세요. 저는 토목전공 대학원생입니다. 선생님 강의를 통해서 머신러닝에 대해서 공부를 하고 있습니다.
먼저 비전공이기 때문에 컴퓨터 언어와 머신러닝 기법에 능숙하지 않은 점은 미리 양해를 구합니다.
 
현재 저는 가지고 있는 실험 데이터를 머신러닝에 접목시키는 시도를 하고 있습니다.
제가 가지고 있는 데이터는 회귀분석이 적합한 것 같아서 기초 개념부분이랑 회귀분석 파트를 주로 집중해서 공부를 했는데요,
엑셀 데이터 파일을 파이썬으로 가져와서 회귀분석하고 RMSE 값을 평가하는 것 까지는 그럭저럭 잘 따라온 것 같았습니다.
 
데이터의 내용을 간략하게 말씀드리면
흙의 일축압축강도를 UCS라고 하는데 UCS를 결정짓는 여러 파라미터를 가지고 UCS 값을 예측하고자 하였습니다.
그래서 UCS가 Output 이고 input 값들로는 폴리머의농도(1.0, 1.5, 2.0, ...), 초기함수비(20, 30, 60, ...) 테스트함수비(0.32, 2.33, 60.23, ...), 건조 단위중량(1,23, 1,35, ...), 흙의 종류(CL, SP, SP-SM), 실험조건(건조, 침수, 초기상태) 등 이 있습니다.
데이터 프레임을 보여드리면 아래와 같습니다.
 
 
아무튼 이렇게 해서 강의 내용을 따라 회귀 분석은 마쳤는데요
제가 궁금한건 이 분석 후에 새로운 데이터가 있을 때 그 데이터의 UCS 값을 어떻게 얻을 수 있는지, 입니다.
혹은 회귀식이나, 함수를 얻을 수 있는지, 입니다.
그리고 이 데이터가 회귀 분석을 하는 것이 적절한 걸까요..?
 
제가 이 분야에 지식이 많이 부족해서 계속 공부하고 검색해서 찾아보곤 있는데
혼자서 공부하는 거라 궁금한 점이 속시원히 해결이 잘 안됩니다ㅠㅠ
막무가내의 질문일 수도 있을 것 같은데,, 도움을 청할 곳이 선생님 밖에 없는 것 같습니다ㅠㅠ
어떤 챕터의 강의를 더 자세히 들어보라거나, 어떤 자료를 참고해라 정도의 답변도 좋습니다!
답변 기다리겠습니다. 감사합니다.

python 통계 머신러닝 배워볼래요?

답변 1

0

권 철민

안녕하십니까, 

1. 학습이 된 모델 객체의 predict() 메소드를 새로운 데이터 (결국은 테스트 데이터)를 입력해서 호출하면 됩니다. 

예를 들어 

linear_regression = LinearRegression()

# 아래는 학습 데이터로 학습합니다. 

linear_regression.fit(학습 데이터피처들, 학습데이터 ucs 값)

# 아래는 새로운 feature 데이터를 입력하여 예측 결과 ucs값을 얻습니다. 

예측 결과 ucs 값 = linear_regression.predict(새로운 데이터 피처들)

2. ucs값이 연속형 숫자 값이므로 회귀를 적용하는 것이 맞습니다.  

혹시나 rmse와 같은 성능 평가결과가 좋지 않아서 회귀를 적용하는 것이 맞는 건지를 물어 보신거라면 성능 평가 지표등을 함께 올려 주시면 좋을 것 같습니다. 

모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.

0

50

2

안녕하세요 열심히 수강중인 학생입니다

0

86

2

정수 인덱싱

0

86

2

넘파이 오류

0

108

2

11강 numpy의 axis 축 질문 드립니다.

0

106

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

92

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

76

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

83

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

73

2

5강 강의 오류가 있어요.

0

90

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

81

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

75

3

파이썬 다운그레이 후 사이킷런 재설치

0

128

2

좋은 강의 감사합니다.

0

79

2

scoring 함수 음수값

0

72

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

108

2

분류 평가 정확도 예측

0

87

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

114

1

카카오톡 채널 있나요

0

117

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

193

2

pca 스케일링 관련하여 질문드립니다.

0

109

2

주피터 대신 구글 코랩

0

184

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

155

2

실루엣 스코어..

0

91

2