RAG(Retrieval Augmented Generation: 검색 증강 생성) 무엇인가?

RAG란 무엇인가?

RAG는 외부 소스에서 가져온 정보로 생성형 AI 모델의 정확성과 신뢰성을 향상시키는 기술이다.

즉, LLM의 작동 방식에서 부족한 부분을 채워주는 기술이다. LLM은 내부적으로 신경망이며, 일반적으로 얼마나 많은 매개변수가 포함되어 있는지에 따라 측정된다. LLM의 매개변수는 기본적으로 인간이 단어를 사용해 문장을 구성하는 일반적인 패턴을 나타낸다.

‘매개변수화된 지식’이라고도 하는 이러한 심층적인 이해 덕분에, LLM은 일반적인 프롬프트에 빠른 속도로 응답하는 데 유용하다. 그러나 최신 주제나 특정 주제에 대해 더 깊이 알고 싶어하는 사용자에게는 적합하지 않을 수 있다.

사람들이 RAG를 사용하는 방법

사용자는 RAG를 통해 기본적으로 데이터 저장소와 대화할 수 있고, 새로운 경험을 하게 된다. 즉, RAG의 응용 분야는 사용 가능한 데이터 세트 수의 몇 배에 달한다.

예를 들어, 의료 지수로 보강된 생성형 AI 모델은 의사나 간호사를 위한 훌륭한 보조 도구가 될 수 있다. 재무 분석가는 시장 데이터에 연결된 비서의 도움을 받을 수 있다.

실제로 거의 모든 비즈니스에서 기술, 정책 매뉴얼, 동영상, 로그 등을 지식 베이스라는 리소스로 전환해 LLM을 향상시킬 수 있다. 이러한 리소스는 고객과 현장 지원, 직원 교육, 개발자 생산성 등의 분야에서 활용될 수 있다.

이러한 광범위한 잠재력 때문에 엔비디아를 비롯한 아마존웹서비스(AWS), IBM, 글린(Glean), 구글(Google), 마이크로소프트(Microsoft), 오라클(Oracle), 파인콘(Pinecone) 등의 기업들이 RAG를 채택하고 있다.

김경민 기자 kyung130603@gmail.com

상단영역