[好讀] RAG比你想像的更簡單、更強大

「檢索」不侷限於文檔，「增強」來自好的 UX 設計

Jun 20, 2024

原文：https://thagomizer.com/blog/2024/06/17/rag-is-simple-and-powerful.html

📌 引言

檢索增強生成（Retrieval Augmented Generation, RAG）是一種通過檢索相關資訊並將其新增到提示中，來防止大語言模型（LLMs）產生錯誤或虛構內容的技術。雖然乍一看可能顯得複雜，但這種方法實際上既簡單又強大。

📌 基礎知識

RAG 的核心是檢索相關資訊以支撐 LLM 的回答。一個常見的例子是客戶服務工作中，通過檢索相關的手冊頁面，幫助 LLM 給出精準的回答。

📌 「檢索」不僅止於文檔

較小的文字：RAG 不僅可以應用於大型文件，還可以用於較小的文字片段，如員工簡介、產品描述或書籍摘要，極大地擴展了其應用範圍。
資料庫和網路服務：資訊的檢索不侷限於文件，還可以來自資料庫或網路服務。這種方法可以通過提供即時資料（如天氣預報或最近的訂單資訊）來增強回答的精準性和相關性。

📌 「增強」來自好的 UX 設計

💡You can ask an LLM to improve the user’s prompt before you look for related content in a vector database to increase the chances of finding relevant data

多樣本提示：在提示中使用多個示例來引導 LLM 的回答。這一技術可以通過記錄和分析提示、回答以及使用者評分來進一步最佳化。
提示改進：在檢索資訊之前，先讓 LLM 最佳化使用者的提示，可以提高檢索結果的相關性。例如，通過描述一張圖片，來在目錄中找到相似的產品。

📌 結論

RAG 也許看起來有些複雜，但它實際上只有三個步驟：檢索相關資訊、增強提示和生成回答。這個簡單而直接的方法可以用於多種應用，是提高 LLM 回答質量的多功能工具。

《非正式寫作》

Discussion about this post