• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

선생님 질문있습니다. 회귀 예측에서 새로운 테스트 데이터를 입력해서 어떻게 결과를 찾아내는 지 궁금합니다.

21.11.24 16:21 작성 조회수 141

0

- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
 
안녕하세요. 저는 토목전공 대학원생입니다. 선생님 강의를 통해서 머신러닝에 대해서 공부를 하고 있습니다.
먼저 비전공이기 때문에 컴퓨터 언어와 머신러닝 기법에 능숙하지 않은 점은 미리 양해를 구합니다.
 
현재 저는 가지고 있는 실험 데이터를 머신러닝에 접목시키는 시도를 하고 있습니다.
제가 가지고 있는 데이터는 회귀분석이 적합한 것 같아서 기초 개념부분이랑 회귀분석 파트를 주로 집중해서 공부를 했는데요,
엑셀 데이터 파일을 파이썬으로 가져와서 회귀분석하고 RMSE 값을 평가하는 것 까지는 그럭저럭 잘 따라온 것 같았습니다.
 
데이터의 내용을 간략하게 말씀드리면
흙의 일축압축강도를 UCS라고 하는데 UCS를 결정짓는 여러 파라미터를 가지고 UCS 값을 예측하고자 하였습니다.
그래서 UCS가 Output 이고 input 값들로는 폴리머의농도(1.0, 1.5, 2.0, ...), 초기함수비(20, 30, 60, ...) 테스트함수비(0.32, 2.33, 60.23, ...), 건조 단위중량(1,23, 1,35, ...), 흙의 종류(CL, SP, SP-SM), 실험조건(건조, 침수, 초기상태) 등 이 있습니다.
데이터 프레임을 보여드리면 아래와 같습니다.
 
 
아무튼 이렇게 해서 강의 내용을 따라 회귀 분석은 마쳤는데요
제가 궁금한건 이 분석 후에 새로운 데이터가 있을 때 그 데이터의 UCS 값을 어떻게 얻을 수 있는지, 입니다.
혹은 회귀식이나, 함수를 얻을 수 있는지, 입니다.
그리고 이 데이터가 회귀 분석을 하는 것이 적절한 걸까요..?
 
제가 이 분야에 지식이 많이 부족해서 계속 공부하고 검색해서 찾아보곤 있는데
혼자서 공부하는 거라 궁금한 점이 속시원히 해결이 잘 안됩니다ㅠㅠ
막무가내의 질문일 수도 있을 것 같은데,, 도움을 청할 곳이 선생님 밖에 없는 것 같습니다ㅠㅠ
어떤 챕터의 강의를 더 자세히 들어보라거나, 어떤 자료를 참고해라 정도의 답변도 좋습니다!
답변 기다리겠습니다. 감사합니다.

답변 1

답변을 작성해보세요.

0

안녕하십니까, 

1. 학습이 된 모델 객체의 predict() 메소드를 새로운 데이터 (결국은 테스트 데이터)를 입력해서 호출하면 됩니다. 

예를 들어 

linear_regression = LinearRegression()

# 아래는 학습 데이터로 학습합니다. 

linear_regression.fit(학습 데이터피처들, 학습데이터 ucs 값)

# 아래는 새로운 feature 데이터를 입력하여 예측 결과 ucs값을 얻습니다. 

예측 결과 ucs 값 = linear_regression.predict(새로운 데이터 피처들)

2. ucs값이 연속형 숫자 값이므로 회귀를 적용하는 것이 맞습니다.  

혹시나 rmse와 같은 성능 평가결과가 좋지 않아서 회귀를 적용하는 것이 맞는 건지를 물어 보신거라면 성능 평가 지표등을 함께 올려 주시면 좋을 것 같습니다.