내가 `RAG를 활용하여 LLM만들어보기` 라고 제목은 정했지만, 전체적인 흐름과 뜻은 무엇일까?
LLM을 활용하여 AI를 만들면 아래와 같은 흐름으로 동작하게 되는데, 이때 자주 사용되는 단어와 의미를 알아보려 한다.
[사용자 질문] → [프롬프트 구성] → [LLM 호출] → [필요하면 검색] → [답변 생성]
- LLM
- Large Language Modal, 즉 많은 글을 학습하여 글을 이해하고 대답할 수 있는 AI의 뇌를 의미한다.
- Prompt
- AI에게 시킬 일을 글로 설명한 지시문을 의미한다.
- Embedding
- 문장을 숫자로 바꾼것을 의미한다.
- 이를 하는 이유는, `강아지`와 `개`라는 단어를 봤을 때, 숫자로 변경하여 벡터값을 사용해 얼마나 유사한 값을 가지고있는지를 판단하는 역할을 한다.
- Vector Store
- 문장을 숫자로 저장하고 비슷한 걸 빠르게 저장해주는 저장소를 의미한다.
- Vector Score
- 유사도 점수로서, 질문과 문서 조각이 얼마나 비슷한지 계산한 숫자.
- 1에 가까울수록 비슷하다.
- RAG
- Retrieval-Augmented Generation) 으로,
AI가 잘 모르면, 외부 자료를 찾아보고 대답할 수 있도록 하는 기술을 의미한다.
- Retrieval-Augmented Generation) 으로,
- Chain
- 여러 단계를 묶어서 자동으로 처리하게 만든 흐름도를 의미한다.
- LangChain 의 기본 흐름을 의미한다.
- LangChain
- LLM을 연결하여 프로그램처럼 쓸 수 있게 도와주는 도구, Framework를 의미한다.
- Memory
- 가끔 chatgpt 를 쓰다보면 memory 저장중... 이라고 나오는 부분이 있는데, 앞에 나눈 대화를 기억하는 기능을 의미한다.
'RAG 을 활용하여 LLM 만들어보기' 카테고리의 다른 글
| Retrieval 효율 개선을 위한 데이터 전처리 (2) | 2025.08.04 |
|---|---|
| Pinecone 과 LangChain을 활용한 Vector Database 변경 (2) | 2025.07.30 |
| LangChain을 활용하지 않고 RAG 구성해보기 (2) | 2025.07.27 |
| 환경설정 및 LangChain과 Chroma를 활용한 검증 및 RAG 구성해보기. (0) | 2025.07.20 |
| LLM에 관심을 가지게 된 계기와 필요 배경 지식 (4) | 2025.07.09 |