inflearn logo
강의

講義

知識共有

安定的なAIエージェントサービス運用のための評価(Evaluation)手法

agent 평가 관련 문의 드립니다.

25

mglee8619

投稿した質問数 4

0

안녕하세요. 좋은 강의 잘 들었습니다.

몇가지 문의 드립니다.

" '운영에 배포할만한 가치가 있는 agent 인가?'를 평가한다 "는 말이 기억에 남습니다.

감사합니다.

python langchain langgraph

回答 1

0

jasonkang

안녕하세요! 좋은 질문 감사합니다. 답변을 드려보자면

  1. 별도의 함수를 선언하지 않는다면 lambda를 쓰는게 가장 파이썬스러운게 아닌가 생각합니다. 다만 코드가 오히려 지저분해지지 않을까 싶네요. 공식문서에도 함수를 쓰는 걸로 업데이트가 된 걸 보면, 별도의 함수를 선언하는 것이 가장 적합한 것 같습니다 https://docs.langchain.com/langsmith/evaluate-llm-application#reference-code

  2. 저라면 답변의 정확도를 기본적으로 평가하고

    1. 대신 평가 데이터셋을 사람의 답변에 따라 여러가지로 구현해서 다양한 시나리오를 평가하는 식으로 구현할 것 같습니다(만약 사람의 답변이 중요하다면)

    2. 그리고

      human-in-the-loop를 제대로 실행 하는지 (trajectory)를 추가로 평가할 것 같아요

  3. 제가 강의 슬라이드를 공유하지 않았군요, 덕분에 강의자료를 수정했습니다 감사합니다.

    1. 아마존 링크: https://docs.aws.amazon.com/machine-learning/latest/dg/evaluating_models.html

    2. 세일즈포스 논문링크: https://arxiv.org/abs/1806.08730


좋은 피드백 감사합니다!

0

mglee8619

빠른 피드백 감사합니다!

좋은 하루 되세요~

pyproject copy.toml 파일 문의

0

9

0

26년 1회실기

0

13

1

26,27강 진행 간 노션, html 프롬프트 파일 불일치

0

18

3

강의 자료

0

18

1

27:15 break 출력

0

17

1

kaggle notebook에 service key 설정이 누락된 것 같습니다

1

22

2

수업 노트가 안 보입니다.

0

22

1

Python formatter 설치

0

23

1

55강 파이썬에만있는 연산자들

0

34

2

55강의 파이썬에서만 있는 연산자들

0

25

2

주말에 실행할 경우 update_economic_data_in_background에 로직 변경 필요성

1

33

1

naver 글자 수집 오류 건

0

26

1

쥬피터 노트북이 실행이 안됩니다.

0

29

1

뒤로가기 버튼 같은 것이 있나요?

0

31

1

Replit 강의 자료가 안나와요

0

23

1

강의 연장 문의

0

36

1

프로그램 실행시간에 대한 질문

1

27

2

비중 및 매수 종목수 조정.

1

33

2

Claude api가 소식 동기화가 늦는 문제

1

44

2

[긴급요청2] 28강 동영상 오류(27강 음성 재생) 수정 예정일자를 알려주세요

0

26

1

codex에게 대용량 코드베이스를 인식 시키는 방법은 어떤게 있나요?

0

35

1

multi_tool_agent.py 에서 arxiv tool 에러

0

21

1

강의자료 오류

0

71

1

Golden Dataset 권장사항 부분 질문

0

80

2