inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 파이썬 머신러닝 완벽 가이드

머신러닝에 대한 질문있습니다.

해결된 질문

188

gkgktmd

작성한 질문수 16

0

안녕하세요 좋은 강의 잘 듣고 있는 수강생입니다.

2가지의 질문이 있어서 게시판에 글을 남깁니다.

1. 일단 강의는 기초만 들은 상태이고 아이리스 말고 실제 데이터로 적용해볼까 하는데(보험업 종사자입니다.)

예를 들어 2년간 쌓인 데이터로 보험 갱신율에 대해 작업해보고 싶은데

현재 강의에서는 테스트 데이터 안에서만 나눠서 학습시킨 후 검증에서 끝나더라구요.

결과가 궁금한 데이터에 대해서 적용해보는 것까지는 나오지가 않더라구요.

그러면 만약 실 데이터에 적용해본다고 하면

기존 2년간 갱신한 고객의 데이터를 kfold로 나눠서 fit과 predict를 해보고 검증 결과가 괜찮다면

(물론 더 나은 모델이 있을 수 있고 과적합? 문제도 있을 수 있지만 아직 배우지 않아서 차치하고)

올해 고객데이터를 불러와서 그대로 predict메쏘드로 돌려서 결과를 산출하면 될까요?

2. 아무래도 개인정보에 굉장히 민감한 업종이다 보니 개인정보를 파이썬에 업로드 하는거 문제는 없을까요?

구글에서 데이터를 빼갈리는 없겠지만..ㅎㅎ

통계 머신러닝 배워볼래요? python

답변 3

0

권 철민

넵, 그렇습니다.

0

gkgktmd

클라우드에 올려서 파이썬에서 호출할건 아니고(회사컴은 클라우드 접속이 막혀있습니다.)

회사컴퓨터에 파일 저장 후 파이썬으로 로컬로 바로 부를건데 

파이썬 자체는 클라우드 같은게 아니라서 별문제 없다는 말씀이시죠?

빠르고 친절한 답변 감사합니다! 

0

권 철민

안녕하십니까

1. 실 데이터를 가지고 계시다니, 충분히 생각하신 방향으로 활용해 보실 수 있을 것 같습니다.

일단 과거 2년 데이터로 cross validation하게 학습/검증 후에, 올해 데이터로 predict하여 결과를 산출하면 될 것입니다.

2. 내부의 서버를 사용하신다면 개인정보 규제에 문제가 없을 거 같습니다만 회사에 따라서는 특정 운영자 외에는 아예 개인 정보에 접근을 막는 경우가 있으니 회사 내부 규정을 먼저 살펴 보셔야 할 것 같습니다. 

그리고 클라우드등 타 서버에 올려서 테스트 할 경우에는 회사 내부 규정에 문제가 없는지 반드시 확인해 보셔야 할 것 같습니다.

파이썬과는 무관합니다.

안녕하세요 열심히 수강중인 학생입니다

0

60

2

정수 인덱싱

0

68

2

넘파이 오류

0

83

2

11강 numpy의 axis 축 질문 드립니다.

0

85

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

77

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

69

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

75

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

64

2

5강 강의 오류가 있어요.

0

84

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

72

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

69

3

파이썬 다운그레이 후 사이킷런 재설치

0

116

2

좋은 강의 감사합니다.

0

72

2

scoring 함수 음수값

0

67

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

99

2

분류 평가 정확도 예측

0

76

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

98

1

카카오톡 채널 있나요

0

106

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

189

2

pca 스케일링 관련하여 질문드립니다.

0

100

2

주피터 대신 구글 코랩

0

172

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

146

2

실루엣 스코어..

0

84

2

float64 null 값 처리 방법

0

102

2