본문 바로가기

retriever2

[We-Co] RAG - LangChain , return_source_documents 안녕하세요. 위기의 코딩맨입니다.이번에 RAG를 구성하는데 문제가 발생했습니다. 참조할 PDF파일이 2개가 있었는데2개의 파일을 비교하면 비교가 되지않고,1개의 파일씩 검색하면 검색이 되는 문제였습니다.[ 문제 ]예를 들어보겠습니다.24년도 OOO 정보와 25년도 OOO 정보를 비교해서 알려줘이렇게 질문을 하면.. 답변을..죄송하지만, 2024년도 OOO 정보는 제공되지 않았습니다. 2025년도 OOO 내역만 확인할 수 있습니다. 2025년도 OOO 정보는 ~입니다. 2024년도에 대한 정보는 알 수 없습니다. 그래서 24년도와 25년도 따로 검색을 진행해봤습니다.24년도 OOO 정보를 알려줘25년도 OOO 정보를 알려줘24년도 OOO정보는 ~입니다.25년도 OOO정보는 ~입니다. 해당 방식으로 검색은 .. 2025. 7. 16.
[We-Co] RAG 검색과 응답 최적화 - Chunking 안녕하세요. 위기의 코딩맨입니다.오늘은 RAG의 검색과 응답을 최적화하는 방법 중 하나인 Chunking에 대해서간단하게 알아보도록 하겠습니다. 일단 청킹 작업은 관련 문서를 가져오는Retrieval에서 개선할 수 있는 요소 중 하나라고 생각해주시면 됩니다.벡터화된 문서를 검색하는 과정을 조 금더 정확하게 검색되도록 최적화 하는 방법을 알아보는 것입니다! [ chunking ]문서를 검색하려면, 해당 문서를 가공하여 최적화된 상태로 변환하는 과정이 필요합니다.이러한 전처리 과정 중 핵심적인 과정이 청킹 입니다. 문서를 분할하는 단계로 보시면 됩니다. 관리에 용이함검색 정확도가 높아짐일관성 유지 기본적으로 청킹 작업을 진행하게되면 문자 수를 기반으로 분할으로 진행됩니다.구조가 고려되지 않음중요한 정보가 분.. 2025. 7. 8.
반응형