교차 평가 시 Evaluator 사용 관련 질문
안녕하세요, 선생님
교차 평가 부분 강의를 듣다가 궁금한 점이 생겨 글 남깁니다.
CrossValidator나 TrainValidationSplit 객체 생성 시 인자로 Evaluator 객체(evaluator_accuracy)가 들어가는데요, 강의 자료의 실습 코드를 보면 모델 객체 예측 후 정확도를 평가할 때 evaluator_accuracy 변수에 객체를 다시 생성해서 할당하는데 특별한 이유가 있나요?
예를 들면, spark_cross_validation_hyperparameter_tuning.ipynb의 cmd 24에서는 18라인에 evaluator_accuracy_01 객체를 생성하고 이를 CrossValidator 생성 시 파라미터로 넘기는데, cmd 25에서 evaluate()을 실행 전에 evaluator_accuracy 변수를 새로 생성해서 정확도를 출력합니다. 그냥 위에서 생성한 evaluator_accuracy_01에서 evaluate()를 수행하면 안되나요?
감사합니다.
답변 1
1
안녕하십니까,
네, 그대로 사용하셔도 됩니다. 제가 다시 만든 이유는 소스 코드가 길어서 설명을 하려면 앞 셀에서 만든것을 다시 찾아 올라가서 설명드려야 하기 때문에 만들었을 뿐입니다.
감사합니다.
강사님 안녕하세요 ㅎdatabricks환경에 대한 설
0
63
3
데이터 브릭스 이슈
0
111
2
데이터 브릭스 가입
0
98
2
pyspark local 설치
0
101
2
community edition 가입 문의
0
113
2
데이터 로드 및 로딩 된 파일 데이터 목록 조회 방
0
171
2
클러스터 버전 설정
0
136
3
instacart market basket analysis
0
189
3
spark 추가 학습 관련 질문
0
235
2
MLOps 관련 MLFLow 및 Databricks 모델 서빙
0
404
1
train파일 업로드 중에 해당 경로가 없다고 뜹니다
0
376
2
강의가 재생되지 않음
0
266
2
후속 강의 계획 질문드립니다.
0
374
1
spark_xgboost_lightgbm 강의부분 관련
0
476
1
spark환경에서 데이터 수정에 관하여 질문이 있습니다.
1
327
1
Spark를 이용하여 binary file -> parquet, csv 변환 가능여부
0
574
1
SPARK 2 강의 오픈
0
499
1
Spark ML 모델 서빙
0
571
1
mac os ) zip 파일 dataframe 오류
0
674
1
ModuleNotFoundError : No module named 'mmlspark' - 20230218
0
631
1
TrainValidationSplit과 randomSplit 사용 질문
0
403
1
현업에서는 scala-spark를 사용하나요? py-spark를 사용하나요?
0
519
1
cluster 생성 Database runtime version 질문
0
277
1
Pandas vs Spark: 비용, 처리시간 비교
0
1241
1





