소개
게시글
질문&답변
기타 질문
확실히 실데이터에 적용해보면서 전처리나 피쳐엔지니어링은 따로 해주긴 했습니다. 사실 아무리 자동화라고 하지만 방대한 도메인 지식을 다 넣을 수도 없으니.. 말씀대로 AI가 많은 발전을 하여 도메인 지식을 반복 습득하여 해당업계의 능력있는 과차장 만큼의 도메인 지식을 습득 할 수 있다면 달라질 수는 있겠군요 좋은 의견 감사합니다!
- 0
- 2
- 305
질문&답변
분류 결과 해석에 대한 질문입니다.
정말 쉽지 않군요 ㅎㅎ 감사합니다 한번 연구해보도록 하겠습니다!
- 0
- 4
- 446
질문&답변
분류 결과 해석에 대한 질문입니다.
저자님 말씀을 듣고 이틀동안 이리저리 해보았는데 도저히 뭐가 잘못됐는지 알 수가 없네요 ㅠ 저자님 코드 그대로 따라서 해보았고 코드상으로도 문제가 없는거 같은데.. (사진) 로우 데이터의 형태이고 renew가 타겟데이터입니다. gap, age, year은 연속형데이터이고 나머지는 범주형 데이터를 숫자로 인코딩 했습니다. (gap이 혼자 튀긴 하는데 gap은 추가적으로 넣은 데이터이긴 합니다. 그전에도 결과는 그닥..) (사진) 위와 같이 타겟데이터와 피쳐데이터를 분리하였고 (사진) (사진) 결정트리와 랜덤포레스트는 저자님 말씀대로 학습데이터로 해본결과 잘 나왔습니다. 다만 lightgbm이(사진) 위와같이 학습데이터로 이밸류에이션을 해도 영 좋지 않게 나오더군요. (evals에 쓴 데이터는 별도의 데이터입니다) 물론 결정트리와 랜덤포레스트도 테스트 데이터를 넣으면 성능이 나오지 않으니 과적합이고 좋은데이터가 아닌가 싶기도 한데 lightgbm은 왜 학습데이터 조차 안좋게 뱉어내는걸까요? (gap숫자가 워낙 튀고 범주형, 연속형 피쳐데이터가 혼재되어있어서 그런가 싶기도 하고.. 아무리 짱구를 굴려봐도 해답이 나오지 않네요ㅠ) 길게 질문드려 죄송합니다 ㅠ
- 0
- 4
- 446
질문&답변
lgith gbm의 장점 질문
그렇군요 감사합니다!
- 1
- 2
- 353
질문&답변
정밀도/ 재현율 관련 질문입니다.
아 저는 문자 그대로 네거티브에 의미를 둬서 현실세계에서 네거티브한 거를 n으로 두고 했는데 (예를 들면 보험갱신고객을 P, 갱신하지않고 이탈한 고객을 N으로, 여기서 이탈한 고객이 분석대상) 그냥 이탈한고객을 P로 두고 하라는 말씀이시군요 감사합니다!
- 0
- 3
- 249
질문&답변
머신러닝 전처리 질문이 있습니다.
그렇군요 감사합니다!
- 0
- 2
- 135
질문&답변
cross_val_score에 대한 질문이 있습니다.
감사합니다!
- 0
- 4
- 578
질문&답변
cross_val_score에 대한 질문이 있습니다.
아 그렇다면 cross는 사실상 정확도를 빠르게 확인하기 위함이고 학습된 정보를 기반으로 실데이테를 예측해보는건 kfold로 해야된다는 말씀이실까요? (그냥 스플릿 트레인 테스트말고 5번 나눠서 하는 형식으로 하고 싶은 경우)
- 0
- 4
- 578
질문&답변
로컬 피시에 저장된 csv파일 불러오기
콜랩은 클라우드상에 업로드 해야만 파일을 불러올 수 있군요 ㅠ 로컬파일 불러오려니 계속 에러가 나서 쥬피터로 실행해보니 바로 불러와지네요 ㅠ
- 0
- 2
- 3.4K
질문&답변
머신러닝에 대한 질문있습니다.
클라우드에 올려서 파이썬에서 호출할건 아니고(회사컴은 클라우드 접속이 막혀있습니다.) 회사컴퓨터에 파일 저장 후 파이썬으로 로컬로 바로 부를건데 파이썬 자체는 클라우드 같은게 아니라서 별문제 없다는 말씀이시죠? 빠르고 친절한 답변 감사합니다!
- 0
- 3
- 130