반응형
안녕하세요. 위기의 코딩맨입니다.
요즘 일과 자격증 공부로 인해 아주 바쁘게 살고있어 포스팅을 못하고 있었습니다..
최근 많이 이슈가 되는 LLM의 RAG에 대해서 한번 살펴보도록 하겠습니다.
[ RAG란? ]
- RAG는 ‘Retrieval-Augmented Generation’의 약자
- 외부 지식(문서·DB 등)을 먼저 검색(Retrieval)
- 텍스트를 생성(Generation)하는 기법
자연어 처리 분야에서 사용되는 기술로써, 정보 검색과 생성을 결합한 모델로 보시면 될것같습니다.
그래서 거의 챗봇이나 문서를 업로드해서 그 문서에 대해서 질의응답을 하는 분야에서 자주 사용됩니다.
크게 2가지 일을 한다고 보시면됩니다.
- 정보 검색 : 사용자에게 질문을 받고, 문서나 데이터베이스 등 답변을 찾고 결과를 LLM에 전달
- 텍스트 생성 : 이제 검색된 답변을 LLM으로 답변을 만들어내는 과정
[ Why? ]
RAG를 사용하는 이유
- 기존 LLM을 사용하여 질의 응답을 하려면 막대한 비용 발생
- 최신 정보 검색 가능
- 문서 검색
- 정확도
모든 답변을 모델 내부 파라미터에 의존하지만, 외부 지식과 검색을 결합하여
더 정확하고 효율적인 답변을 생성할 수 있습니다.
또한, 다양한 분야에 유용하게 사용할 수 있는 장점이 있습니다.
앞으로 RAG를 활용해서 기본적인 문서 업로드, 검색 등 기능을 구현해보도록 하겠습니다.
간단하게 찾아보니 Google, AWS에서 제공하는 솔루션도 다양하게 있더라구요!
앞으로 잘해보도록 하겠습니다.

반응형
'기타' 카테고리의 다른 글
[We-Co] RAG 검색과 응답 최적화 - Chunking (0) | 2025.07.08 |
---|---|
[We-Co] langchain - FewShotPromptTemplate란 무엇일까! (0) | 2025.07.02 |
[We-Co] Jenkins, Gitlab 연동(Docker) [3] (0) | 2025.02.07 |
[We-Co] Jenkins, Gitlab 연동(Docker) [2] (0) | 2025.02.05 |
[We-Co] Jenkins, Gitlab 연동(Docker) [1] (0) | 2025.02.05 |