inflearn logo
강의

Course

Instructor

Large Language Models (LLM) for Everyone Part 2 - Building Your Own ChatGPT with LangChain

SelfQueryRetriever Advanced Example - Let's create a Hotel Search (Hotel Search) application using SelfQueryRetriever

self query retriever 한글

453

lynn

1 asked

0

안녕하세요 query constructor chain 생성하는데

 

df 안에 있는 한글을 넣으면

 

"Sample Stability": { "translation": "\uc0d8\ud50c \uc548\uc815\uc131",

요런식으로 나와서 filter 인식이 안되는데요,

수정하는 코드를 찾아봐도 안나와서 질문드립니다!

chatgpt llm langchain

Answer 2

0

AISchool

안녕하세요~. 반갑습니다.

[상품추천GPT(RecommendationGPT) 만들기 실습] 실습 colab 코드에서 볼수 있듯이 아래와 같이 프롬프트가 구성되어도 제대로 매칭이 이루어지게 됩니다.

{
    "content": "리뷰에 대한 자세한 설명",
    "attributes": {
    "RawText": {
        "description": "The text of the review",
        "type": "string"
    },
    "MainCategory": {
        "description": "The main category of the product. Valid values are ['\uc790\ub3d9\ucc28\uae30\uae30', '\uce74\uba54\ub77c/\uac8c\uc784\uae30/\ud0dc\ube14\ub9bf', '\ucef4\ud4e8\ud130/\uc8fc\ubcc0\uae30\uae30', '\ud734\ub300\ud3f0/\uc8fc\ubcc0\uae30\uae30']",
        "type": "string"
    },
    "ProductName": {
        "description": "The name of the product",
        "type": "string"
    },
    "ReviewScore": {
        "description": "The score given to the product by the reviewer. Valid values are ['1', '2', '3', '4', '5']",
        "type": "integer"
    },
    "RDate": {
        "description": "The date of the review",
        "type": "date"
    },
    "GeneralPolarity": {
        "description": "The overall sentiment of the review. Valid values are ['-1', '0', '1']",
        "type": "integer"
    },
    "Aspects": {
        "description": "List of aspects mentioned in the review with their corresponding sentiment text",
        "type": "array of objects"
    }
}
}

 

따라서 위에 문제는 한글 인코딩 문제라기보다는 attribute_info 변수안에 값을 제대로 구성하지 않은 문제 때문에 에러가 발생한 것 일수도 있을것 같습니다.

attribute_info 에 들어있는 값은

{
"name" : "해당변수명".
"description": "해당변수설명".
"type":"해당변수타입",
}

위와 같이 구성되어야만 합니다. attribute_info 변수에 값을 출력해서 attribute_info안에 값이 위와 같이 제대로 정형화된 형태로 구성되어있는지 다시한번 확인해보시기 바랍니다. (위에 최종 프롬프트를 보면 description, type외에 translation이라는 키값이 추가적으로 들어가있어서 문제가 된것은 아닐까 싶습니다.)

좋은 하루되세요~.

감사합니다.

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다.

langchain에서 한글을 처리할 때 “\uc0d8\ud50c \uc548\uc815\uc성”와 같이 유니코드로 변환되어 인식이 안되는 문제를 겪고 계신 것 같네요. 이는 Python에서 문자열을 다룰 때 발생할 수 있는 인코딩 문제일 수 있습니다.

문제 해결을 위해서는 우선, Python 파일 상단에 인코딩을 명시해보시는 것이 좋습니다.

# -*- coding: utf-8 -*-

또한, 유니코드 문자열을 올바르게 처리하려면 문자열 앞에 u를 붙이거나 .encode('utf-8') .decode('utf-8') 메서드를 적절히 사용해볼 수 있습니다.

예를 들어, 유니코드로 표현된 한글을 제대로 출력하고 싶다면 다음과 같이 처리할 수 있습니다.

print(u'\uc0d8\ud50c \uc548\uc815\uc131'.encode('utf-8'))

만약 langchain 라이브러리 사용 중에 이런 유니코드 문제가 지속되면, 해당 라이브러리의 문서를 참조하거나 langchain 개발자에게 이슈를 제기하는 것도 하나의 방법입니다.

정확한 문제 해결을 위해서는 보다 자세한 코드 컨텍스트나 langchain 라이브러리의 사용 방법을 알아볼 필요가 있습니다. 참고할 만한 자료나 예시가 많지 않다면, 직접 해결을 위한 실험을 해보시거나 해당 오픈소스 커뮤니티에 질문을 올려보시는 것을 권장드립니다.

혹시 로컬llm을 활용해서 RAG를 구현하는 예제도 한번 올려주시면 안될까요?

0

965

2

검증 방법 질문입니다.

0

151

2

with_structured_output 함수

0

796

1

Quickstart 오류 - Query Analysis Quickstart 기초 예제 실습

0

257

2

docStore

0

137

0

langchain.schema가 무슨 역할을 하는지요?

0

491

2

라마 3(Llama 3)로 AI 텍스트 번역하기 실행 오류.

0

979

2

SQL 에이전트 제작 예제 프로그램과 관련하여 질문 드립니다.

0

207

2

하이퍼클로바 X 랭체인

0

391

2

ConversationSummaryBufferMemory의 max_token_limit

0

320

2

SelfQueryRetriever 사용시

0

311

2

!pip install langchain_community 문장이 필요할 것같아요(강의 2,4)

0

1262

2

memory+ Retriever +llm 질문있습니다.

0

228

1

selfqueryRetriever에서 contain,like 필터링 오류문제

1

336

2

상품추천GPT에서 데이터를 바꿔 사용하는데 오류나는 이슈

1

254

2

Rag 사용시 전혀 관계없는 데이터를 가져오는 이슈

0

1293

2

bert vs gpt 의 혼란스러운 점

0

566

2

chromadb 용량

0

556

2

RAG에서 Generator으로 어떤 데이터가 들어가는지 볼 수 있는 방법이 있나요?

0

407

1

RAG 실습 강의에서 template 문구 관련해 질문이 있습니다.

0

445

2

RAG의 데이터 소스로 RDB 사용 시 어떤 로더를 사용해야 하나요?

0

2326

2

db.delete_collection() db가 정의되어 있지 않아 문의드립니다.

0

178

1

GPT api 토큰 제한

0

1739

1

Data Loader 관해서

0

305

2