シリコンバレーエンジニアと一緒に学ぶMLflow

MLFlow model versioning 방법 문의

解決済みの質問2025-03-18T08:14:56.298Z

195

daniel

投稿した質問数 58

언제든지 질문이 있으시면 물어보세요! 질문을 하시면서 배우는 겁니다

스크린샷 2025-03-18 오후 5.12.10.png.webp

mlflow에서 experiment에 기록된 모델을 register model 버튼을 눌러서 models로 옮겼는데요
혹시 버튼을 누르지 않고도 experiment에 등록된 model을 옮기는 방법이 있을까요?

머신러닝 딥러닝 mlflow mlops 인공지능(ai)

回答 1

altoformula

2025-03-18T14:54:52.366Z

안녕하세요 yuki님,

강의 뒷부분에서 나오겠지만, MLflow의 mlflow.register_model() 또는 mlflow.register_model_from_run()을 사용하면 실험에서 모델을 자동으로 Model Registry에 등록할 수 있습니다. 또한 MLflow의 Autologging 기능을 사용하면 모델을 훈련하면서 자동으로 Model Registry에 등록할 수도 있습니다.

예를 들면, 강의 자료 안에 mlruns/mlflow_client_run.py 보시면 코드 예제도 보실 수 있습니다.

필요한 방식에 맞춰 적용하면 될 것 같네요! 😊

daniel

2025-03-19T03:53:35.460Z

안녕하세요, 강사님.

빠른 답변 감사합니다!

현재 저는 각 실험(Experiment)마다 아티팩트를 등록하고 있으며, 모델 추론 시 모델 바이너리 파일뿐만 아니라 해당 run_id에 연관된 아티팩트들을 함께 가져와서 사용하고 있습니다.

실무에서는 이러한 run_id를 어떤 방식으로 관리하는지 궁금합니다.
보통 별도의 저장소(DB, 메타데이터 저장소 등)에 run_id를 저장하여 관리하는지, 아니면 AWS Secret Manager나 Parameter Store와 같은 비밀 관리 서비스에 저장하여 활용하는지 실무 사례가 궁금합니다.

감사합니다! 😊

def load_model_and_preprocessor() -> Tuple[PyFuncModel, joblib.load]:
    """
    Load the model and preprocessor from MLflow.
    """
    model_name = Config.get_mlflow_config().get("model_registry_name")
    run_id: str = Config.get_mlflow_run_id()
    logged_model = f"runs:/{run_id}/{model_name}"
    loaded_model = mlflow.pyfunc.load_model(logged_model)

    # 전처리기 로드
    preprocessor_path = mlflow.artifacts.download_artifacts(
        run_id=run_id, artifact_path="preprocessor.pkl"
    )
    preprocessor = joblib.load(preprocessor_path)

    # 상위 50개 피처 인덱스 로드
    feature_path = mlflow.artifacts.download_artifacts(
        run_id=run_id, artifact_path="top_features_indices.npy"
    )
    top_features_indices = np.load(feature_path)

    return loaded_model, preprocessor, top_features_indices

altoformula

2025-03-19T04:11:44.732Z

안녕하세요.

회사 아키텍쳐를 자세히 말씀드릴 수 는 없지만, 대략만 말씀드리면, 말씀하신 것과 비슷하게 ML 모델이 배포될 때 run_id를 자체 Secrets 관리 도구와 데이타베이스에 저장하고, 모델 서빙 시 해당 서비스에서 run_id를 조회하여 모델 로드하여 사용하고 있습니다.

AWS를 헤비하게 사용하신다면, IAM으로 특정 서비스 또는 사용자만 run_id를 읽을 수 있도록 제한 가능하면 보안이 더 강화되실 겁니다.

daniel

2025-03-19T05:49:40.812Z

너무 감사드립니다.
궁금했던 포인트들이 해소되었습니다!

항상 좋은 강의를 공유해주셔서 너무 감사드립니다.

혹시 kubeflow, feature store과 같은 다른 MLOps 툴들도 강의 제작 예정이 있으실까요?

altoformula

2025-03-19T05:51:39.206Z

저희가 Kubeflow를 사용하고 있지만, 제가 강의 만들어도 별로 강의를 살 사람들이 없어보여서 ㅎㅎㅎ 시간되면, 여기에 익스텐션으로 한번 넣어보겠습니다.

데이터베이스 만들기에서

2026-06-15T21:48:46.430Z

github 세팅 자체를 github desktop을 사용해도 되나요?

2026-06-15T19:08:51.028Z

기출 11회 작업형 2_전체 데이터 학습 여부

2026-06-15T14:14:06.525Z

8강 디버깅 하네스는 verification 하네스와 비슷하게 느껴지는데 결정적인 차이가있을까요?

2026-06-15T13:58:01.000Z

예측값 결과 소수점 차이

2026-06-15T12:49:28.952Z

3강 context harness에서 제시하주신 개념들에 대해 소개된 공식문서나 자료가 있을까요?

2026-06-15T12:46:36.438Z

여태까지 발견한 이슈들 공유드립니다.

2026-06-15T12:04:56.665Z

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

2026-06-15T12:01:43.239Z

전처리 train() test([ ])

2026-06-15T11:35:42.999Z

작업형 1 배경지식 질문

2026-06-15T10:28:19.913Z

슬슬 따라하기가 힘들어진다.

2026-06-15T10:18:53.831Z

옳게 풀은건지 질문드립니다!

2026-06-15T10:16:49.540Z

roc_auc_score

2026-06-15T09:56:39.867Z

추가질문 합니다

2026-06-15T07:23:01.745Z

시험환경 구름

2026-06-15T07:04:56.153Z

섹션5 강의자료 다운로드

2026-06-15T06:32:59.681Z

2유형 질문드려요

2026-06-15T06:24:34.899Z

헤르메스와 코덱스 연결 관련

2026-06-15T06:22:55.743Z

퀴즈가 cowork와 맞지 않아요.

2026-06-15T04:07:39.124Z

RandomForest vs lgb

2026-06-15T01:09:37.269Z

[문의] 섹션 7 미션 진행 중...

2026-06-14T23:10:44.997Z

전처리 관련질문

2026-06-14T22:49:54.479Z

기본 브랜치의 이름이 master에요.

2026-06-14T16:42:23.888Z

[한글화된 강의자료 요청]

2025-08-01T04:22:43.892Z