거대언어모델(LLM, Large Language Model)과 관련한 최신 웹툰사이트 토토사이트를 읽다보면 RAG(Retrieval Augmented Generation, 검색증강생성)이란 단어가 자주 등장한다. '검색증강생성'이란 표현도 참 어색하다. 인공지능 관련 최신 용어들을 적절한 한글로 표현하는 것조차 힘들 정도로 인공지능의 세계는 빠르게 발전하고 있다. RAG(랙)에 대해서 알아보자
RAG이란 무엇인가?
검색증강생성(RAG)은 자연어 처리(NLP) 작업, 특히 개방형 도메인 질문의 답변에 사용되는 접근 방식이다. 검색기반모델과 생성기반모델의 강점을 결합하여 보다 정확하고 유익한 답변을 제공한다.(by Claude) RAG은 LLM의 출력을 최적화하여 응답을 생성하기 전에 LLM 외부의 신뢰할 수 있는 콘텐츠를 참조하는 방식이다.
RAG은 LLM의 문제를 해결하는 한 가지 접근 방식
LLM의 목표는 신뢰할 수 있는 지식 소스를 상호 참조하여 다양한 상황에서 이용자 질문에 답변하는 것이다. LLM 기술의 특성상 LLM 응답에 대한 예측이 불가능하다. LLM 학습 데이터는 정적이며 학습한 이후의 데이터에 대해서는 알 수 없다.
LLM의 알려진 문제점은 다음과 같다.
1. 답변이 없을 때 허위 정보를 제공한다. (환각현상, 할루시네이션, hallusination)
2. 이용자가 구체적이고 최신의 응답을 기대할 때 오래되었거나 일반적인 정보를 제공한다. (out of data)
3. 신뢰할 수 없는 출처로부터 응답을 생성한다. (source)
LLM은 최신 정보가 없을 때도 항상 절대적인 자신감을 가지고 모든 질문에 답변하는 지나치게 열정적인 신입 사원으로 생각할 수 있다. 이러한 반응은 응답 내용에 대한 신뢰에 부정적인 영향을 미친다. RAG는 LLM의 문제 중 일부를 해결하기 위한 한 가지 접근 방식이다. (참고: 아마존)
RAG 접근 방식의 두 가지 주요 구성 요소
1. 검색기(Retriever): 검색기반(retrieval-based)모델로서 일반적으로 'dense passage retriever'나 'sparse vector space' 모델이다. 이 모델의 역할은 입력 질문을 기반으로 대규모 코퍼스(corpus, 예: Wikipedia)에서 관련 구절이나 문서를 검색하는 것이다.
참고: '코퍼스(corpus)'는 검색에서 입력 질문에 대한 관련 정보를 찾기 위해 사용하는 대규모 텍스트 데이터나 문서 모음을 의미한다. 문서저장소, 말뭉치 등으로 표현하기도 한다.
참고: DPR(dense passage retriver)는 질문과 활용 가능한 문서 간의 유사성을 기반으로 관련 구절을 가져오는 RAG 모델의 중요한 구성 요소다. 문서저장소(corpus)를 필터링하여 관련 정보를 찾아 생성기 모델에 전달하는 방식으로 작동한다.
참고: 'sparse vector space'는 정보가 드문드문 채워져 있는 벡터 공간으로 대부분 0이면서 0이 아닌 요소가 몇 개만 있는 벡터 공간을 말한다. 희소 벡터는 머신러닝에서 모델 정규화, 과적합 방지, 모델 해석 가능성 향상을 위한 변수 선택 지원과 같은 작업에 유용하다. sparse vector는 자연어 처리(NLP) 에서 텍스트 데이터를 효율적이고 효과적으로 표현하는데 중요한 역할을 한다.
2. 생성기(Generator): 생성기: 생성형언어(generative language)모델로서 일반적으로 버트(BERT), GPT, T5와 같이 사전 학습된 대규모 트랜스포머 모델이다. 이 모델의 역할은 입력 질문과 검색된 내용을 모두 조건화하여 최종 답변을 생성하는 것이다.
RAG 작동 방식
- 오픈AI, 휴머노이드 로봇 스타트업과 피규어(Figure)와 파트너십 체결 ... 투자자들도 대단
- 오픈토토사이트 롤링 음성기술과 휴머노이드 로봇이 만나면? ... 자비스(Jarvis)의
- 가상 피팅 풀문 토토사이트를 활용한 초간편 패션 중고 거래 플랫폼, 리클로스(ReClos) ... SKT 플라이 풀문
- 다문화가정 소통 다이어리 프로젝트, 다소리 ... SKT 플라이 퍼스타 토토
- 그림이 살아 움직이는 Ai 메타 캐릭터 생성 토토사이트 펫, 그리닷 ... SKT 플라이 AI 챌린저
- 웹소설 숏폼 생성sky 토토사이트 프로젝트, 노벨티(Novel T) ... SKT 플라이
- 아마존, 앤쓰로픽에 투자하고 올림푸스 모델로 bts 토토사이트 사업
- Open토토사이트 공지의 음성 복제 토토사이트 공지 모델, 15초
- 새롭게 떠오르는 생성토토사이트 가입거절 분야: 음악, 생산성 ...
- 메타의 라마(Llama) 3는 구글의 제미나이를 포함한 대부분의 다른 모델을 능가한다고 ... Verge
- 토토사이트 썸 Ai Overview, 검색시장과 미디어 시장에 미칠 영향 ... Don't be
- 아마존의 토토사이트 크롤링 레이크 전환 전략과 실행 ... 버너 보겔스(Werner Vogels) 아마존