📌 引言
檢索增強生成(Retrieval Augmented Generation, RAG)是一種通過檢索相關資訊並將其新增到提示中,來防止大語言模型(LLMs)產生錯誤或虛構內容的技術。雖然乍一看可能顯得複雜,但這種方法實際上既簡單又強大。
📌 基礎知識
RAG 的核心是檢索相關資訊以支撐 LLM 的回答。一個常見的例子是客戶服務工作中,通過檢索相關的手冊頁面,幫助 LLM 給出精準的回答。
📌 「檢索」不僅止於文檔
較小的文字:RAG 不僅可以應用於大型文件,還可以用於較小的文字片段,如員工簡介、產品描述或書籍摘要,極大地擴展了其應用範圍。
資料庫和網路服務:資訊的檢索不侷限於文件,還可以來自資料庫或網路服務。這種方法可以通過提供即時資料(如天氣預報或最近的訂單資訊)來增強回答的精準性和相關性。
📌 「增強」來自好的 UX 設計
💡You can ask an LLM to improve the user’s prompt before you look for related content in a vector database to increase the chances of finding relevant data
多樣本提示:在提示中使用多個示例來引導 LLM 的回答。這一技術可以通過記錄和分析提示、回答以及使用者評分來進一步最佳化。
提示改進:在檢索資訊之前,先讓 LLM 最佳化使用者的提示,可以提高檢索結果的相關性。例如,通過描述一張圖片,來在目錄中找到相似的產品。
📌 結論
RAG 也許看起來有些複雜,但它實際上只有三個步驟:檢索相關資訊、增強提示和生成回答。這個簡單而直接的方法可以用於多種應用,是提高 LLM 回答質量的多功能工具。