inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

LangGraph를 활용한 AI Agent 개발 (feat. MCP)

public 모델 사용시 주의점

42

quan33

작성한 질문수 2

0

안녕하세요 좋은 수업제공해주셔서 많은 도움을 받고있습니다.

 

langChain에 public 모델을 사용할때 개인정보 관련해서 질문이 있는데요

예를 들어 챗봇이나 자동 상담 기능에 적용을 한다고하면 입력이 매우 자유로울거같은데 개인정보에대해서는 어떻게 처리를 해야할까요?

 

기본적으로는 정규식으로 전처리를 하는데 100%보장된 작업은 아니라 현업에서는 어떻게 처리하는지 궁금합니다. 만약 개인정보 처리가 매우 중요하다면 public 모델(ex. chatGPT, gemini)은 사용 못하고 private 한 환경에 오픈소스로 운영할수밖에는 없을까요?

프롬프트엔지니어링 llm ai-agent langgraph mcp

답변 2

0

제이쓴

안녕하세요! 좋은 질문 감사합니다.

아무래도 보안이 이슈다보니 충분히 고민하실 수 있는 것 같은데요, 모델을 호출할 때 개인정보가 넘어가서 보안상 이슈가 있다고 판단하신다면, 말씀하신 것처럼 public모델은 사용하지 않는 게 좋을 것 같습니다. 다만 말씀하신 public 모델들도 이용 약관을 보면 데이터를 훈련에 사용하지 않는다는 등의 보안 문구가 있어서 그들의 약관을 신뢰하느냐의 문제인 것 같습니다.

약관을 신뢰한다면 답변을 생성하고 사용자에게 넘겨줄 때 보안장치를 추가할 수 있는데요, 말씀하신 것처럼 정규표현식을 사용해서 생성되는 답변을 마스킹 처리한다거나 등의 방식을 통해 개인정보 유출을 방지하는 걸 추천드립니다.

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. quan33님께서 질문하신 LangChain에서 public 모델 사용 시 개인정보 처리에 관한 내용에 대해 답변드리겠습니다.

개인정보 보호는 AI 시스템에서 매우 중요한 요소입니다. 특히, 사용자가 챗봇이나 자동 상담 기능과 상호작용할 때 입력되는 정보 중 일부가 민감한 개인정보일 수 있습니다. 이에 따라 개인정보를 안전하게 처리하기 위한 몇 가지 방법을 소개드리겠습니다.

개인정보 처리 방법

  1. 정규식 기반의 데이터 전처리:

    • 정규식을 사용하여 전화번호, 이메일, 신용카드 번호 등 일반적으로 민감한 데이터를 필터링할 수 있습니다. 하지만 정규식만으로 모든 개인정보를 완벽하게 걸러내는 것은 어렵기에, 추가적인 방법과의 병행이 필요합니다.
  2. 데이터 익명화 및 가명화:

    • 텍스트 내 민감한 정보를 전혀 다른 정보로 변환하여 실제 데이터를 노출하지 않는 방법입니다. 이 경우에도 완전한 보안이 아니므로, 다른 방법과 병행해야 효율적입니다.
  3. 사용자 동의와 고지:

    • 개인정보를 수집할 때 명확하게 사용자로부터 동의를 얻고, 처리 방법과 목적에 대해 충분히 고지하는 것이 중요합니다.
  4. 오픈소스 모델과의 혼합 사용:

    • 공공 API를 사용하는 대신, 민감한 정보가 포함될 가능성이 높은 경우에는 오픈소스 모델을 활용하여 사내 서버에서 처리하는 방법도 고려해볼 수 있습니다.
    • 최근 많은 기관에서는 GPT 기반의 모델을 자체 서버에서 구동하여 외부 노출을 최소화하고 있습니다.
  5. 사내 보안 정책과 기술 적용:

    • 보안이 강화된 환경(예: VPN, 방화벽 등)에서 시스템을 운영하고, 지속적인 보안 점검과 모니터링을 적용합니다.

Public 모델 사용의 주의점

  • 공공 클라우드 기반의 서비스는 모델의 학습에 데이터를 사용할 수 있으며, 필요한 경우 이를 명시적으로 막아야 합니다(예: OpenAI에서는 사용자의 데이터를 모델 학습에 사용하는 것을 방지하는 설정이 가능합니다).
  • 민감한 데이터를 다룰 경우, 데이터 자체를 사내 환경의 안전한 서버에서 처리하고 결과만 Public 모델로 보내는 방식을 사용합니다.

질문하신 주제와 관련된 개인정보의 처리 에서 더 많은 정보를 확인할 수 있으며, 해당 게시물에서는 LLM 애플리케이션 개발 시 데이터 보안에 관한 다양한 고려 사항이 논의됩니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

제공해주신 레포가 Windows 환경에 너무 비친화적입니다.

0

38

2

마크다운을 텍스트 파일로 변환하기

0

41

1

max token을 제한하는게 왜 성능을 개선하게 되는걸까요?

0

55

2

pyzerox 유니코드 에러

0

80

2

영상 메타데이터 생성 관련 LLM 활용 질문

0

76

1

종합부동산세 부분 tool 사용 질문 드립니다.

0

81

2

uv sync 파이썬 버전문제 onnxruntime

-1

119

2

MCP를 활용해서 간단한 에이전트를 만들어보세요

0

101

1

PDF 형식

0

72

1

5.3 langchain-mcp-adpater를 활용한 MCP 도구 사용 tool_list 지연 사유

0

96

2

3.6 human_in_the_loop 3rd case

0

83

1

summary 를. 시스템메세지에 추가하는 부분에 관하여

0

80

3

병렬 처리 중 retrieve 관련 궁금한 사항

0

80

1

query 에 대한 answer 결과값이 나오지 않습니다.

0

98

2

사람과 관련된 표현이 없는데 rewrite 로 이동하지 않는경우

0

80

1

retriever 관련 질문

0

66

1

인터룹 관련 질문

0

51

2

2.4 Self-RAG 결과가 달라요!

0

80

2

md vs txt 차이..

0

151

2

OpenAI API 호출 때문에 발생하는 Error code: 429 문제

0

125

2

단순 도구 사용과 도구를 가진 에이전트를 사용하는 것의 차이가 궁금합니다.

0

90

1

LangChain과 LangGraph v1

0

142

1

2.4 강의 관련 질문(답변을 검증하는 self rag)

0

77

2

후속강의 문의

0

75

2