LLM evaluation: 從提示手工藝到提示工程

探討AI專案中評估的重要性，從提示手工藝到提示工程的轉變。介紹自動化評估系統、feedback機制和大語言模型評估方法，助您優化AI應用。

Sep 01, 2024

∙ Paid

❏ 引言

來看一段 AI 專案驗收會議上的真實對話：

客戶👸: 這個案子你們只用 prompt engineering (提示工程) 做？有用到其他 ML 方法嗎？

我們🤓: 是的，包括"非結構化的文字處理"、"風險分類"、"修改建議"，在這次的 POC 專案中主要都是利用 prompt engineering 做到的。

客戶👸: 如果未來我們有更多種檔案格式需要支援或是需要增加新分類，prompt 是不是又要修改？prompt 越寫越長，token 越用越多，不會很貴嗎？
...
客戶👸: 雖然你們的結果有做到高於驗收標準，但是我們的 user 使用起來體驗還不是不太好，如果要請你們進一步優化，你們會怎麼做？也是只改改 prom…

Keep reading with a 7-day free trial

Subscribe to 《非正式寫作》 to keep reading this post and get 7 days of free access to the full post archives.