const systemPrompt = 您正在檢查一個顧客和Example bank聊天機器人之間的對話。查看Example bank的政策、產(chǎn)品或服務(wù)的文檔對于聊天機器人回應(yīng)顧客是必要的。請構(gòu)建一個搜索查詢,該查詢將被用于檢索相關(guān)文檔,以便回應(yīng)用戶。
let optimizedSearchQuery = await this.textCompletionEngine.complete(
[
{ role: ‘system’, content: systemPrompt },
{ role: ‘user’, content: stringifyChatConversation(messages) }
],
‘gpt-4’,
{
temperature: 0,
maxTokens: 100,
},
);
這種技術(shù)的一個變體是查詢擴展,LLM生成多個子搜索查詢。這種變體在具有混合檢索系統(tǒng)的RAG系統(tǒng)中特別有用,該系統(tǒng)將來自具有不同結(jié)構(gòu)的多個數(shù)據(jù)存儲庫的搜索結(jié)果結(jié)合在一起(例如,SQL數(shù)據(jù)庫+單獨的向量數(shù)據(jù)庫)。其他提示工程技術(shù),如后退提示和HyDE(在下一節(jié)中討論),也可以與這種方法結(jié)合使用。
技術(shù)7:使用假設(shè)性文檔嵌入(HyDE)
在信息檢索中,查詢-文檔不對稱指的是用戶提出的查詢與文檔庫中實際文檔之間的語義差異。為了解決這一問題并提高檢索結(jié)果的語義相似性,可以應(yīng)用一種稱為假設(shè)性文檔嵌入(HyDE)的技術(shù)。以下是對這項技術(shù)的詳細介紹:
- 問題背景:
- 在信息檢索領(lǐng)域,查詢-文檔不對稱性可能導致用戶提出的查詢與文檔庫中的實際文檔之間存在較大的語義差距,從而影響檢索結(jié)果的準確性和相關(guān)性。
- HyDE技術(shù):
- HyDE是一種利用大型語言模型(LLMs)的技術(shù),旨在通過在檢索發(fā)生之前生成一個假設(shè)性文檔或文檔塊來解決查詢-文檔不對稱問題。
- 在HyDE技術(shù)中,通過向LLM提供特定的提示,要求其生成一個假設(shè)性文檔或文檔塊,這個文檔或塊會回答用戶提出的查詢。
- 生成的假設(shè)性文檔或文檔塊通常會被嵌入到語義搜索中,用作替代用戶查詢進行檢索。這樣做的目的是假設(shè)性文檔或文檔塊與用戶查詢相比具有更高的語義相似性,從而提高檢索結(jié)果的準確性和相關(guān)性。
- 應(yīng)用場景:
- HyDE技術(shù)在復(fù)雜的信息檢索系統(tǒng)中特別有用,如基于RAG(Retrieval-Augmented Generation)模型的系統(tǒng),其中查詢-文檔不對稱性對檢索結(jié)果產(chǎn)生較大影響。
- 通過使用HyDE技術(shù),可以在檢索階段改善語義相似性,使得檢索結(jié)果更貼近用戶實際需求,提高系統(tǒng)的性能和用戶體驗。
- 優(yōu)勢與挑戰(zhàn):
- 優(yōu)勢:HyDE技術(shù)可以幫助解決查詢-文檔不對稱問題,提高檢索結(jié)果的語義相似性,增強系統(tǒng)的智能和準確性。
- 挑戰(zhàn):在實踐中,需要設(shè)計有效的提示和生成假設(shè)性文檔的策略,以確保生成的文檔或文檔塊能夠有效地補充用戶查詢,而不是引入更多的噪聲或不相關(guān)信息。
通過使用HyDE技術(shù),可以改善信息檢索系統(tǒng)的性能,提高檢索結(jié)果的質(zhì)量,使得系統(tǒng)更加智能和適應(yīng)用戶需求。
技術(shù)8:實現(xiàn)查詢路由或RAG決策器模式
在這個技術(shù)介紹中,提到了兩個關(guān)鍵概念:查詢路由和RAG決策器模式,這些是用于增強檢索系統(tǒng)性能和效率的先進技術(shù)。
- 查詢路由:
- 查詢路由是一種利用大型語言模型(LLMs)將搜索查詢路由到適當數(shù)據(jù)庫的技術(shù)。當一個RAG系統(tǒng)涉及多個數(shù)據(jù)源時,查詢路由可以幫助確定應(yīng)該將查詢發(fā)送到哪個數(shù)據(jù)庫,以獲得最佳結(jié)果。
- 在查詢路由中,需要預(yù)定義路由決策選項,并解析LLM的輸出來做出正確的路由決策。這有助于提高系統(tǒng)的效率和查詢結(jié)果的準確性。
1. RAG決策器模式:
- RAG決策器模式是一種用于提升RAG系統(tǒng)性能的技術(shù)變種。它的目標是降低成本并改善質(zhì)量。
- 該模式的一個關(guān)鍵思想是識別出當LLM能夠獨立回答查詢而無需外部知識時,可以避免進行完整的RAG查找。這種識別可以提高系統(tǒng)的效率,特別是對于簡單問題或在對話歷史中已經(jīng)存在所需信息的情況。
2. 應(yīng)用場景:
- 查詢路由和RAG決策器模式適用于那些需要處理多個數(shù)據(jù)源并希望提高檢索效率和準確性的系統(tǒng)。
- 通過合理使用這些技術(shù),系統(tǒng)可以更智能地決定何時進行全面的RAG查找,何時可以直接回答查詢,從而提高系統(tǒng)的響應(yīng)速度和用戶體驗。
3. 優(yōu)勢與挑戰(zhàn):
- 優(yōu)勢:查詢路由和RAG決策器模式可以幫助提高系統(tǒng)的效率、降低成本,并加強查詢結(jié)果的準確性。
- 挑戰(zhàn):在實踐中,需要精心設(shè)計路由決策選項和決策邏輯,以確保系統(tǒng)能夠正確地判斷何時應(yīng)用RAG查找,何時可以直接回答查詢。
通過實現(xiàn)查詢路由和采用RAG決策器模式,可以使檢索系統(tǒng)更加智能和高效,提升用戶體驗,并為系統(tǒng)的運行和維護帶來更多便利。
后記
以上就是檢索中可用的3種高級RAG技巧。
預(yù)檢索即檢索前的5種RAG高級技巧,可以閱讀歷史文章:從預(yù)檢索到生成的15種高級RAG技術(shù)(篇一)
明天我們將繼續(xù)分享:檢索后的3種RAG高級技巧。
敬請期待…
AI智能時代,我們更需要成為一個獨立思考、獨一無二的個體。持續(xù)學習,遇見不一樣的自己。
文章轉(zhuǎn)自微信公眾號@耳東觀察
我們有何不同?
API服務(wù)商零注冊
多API并行試用
數(shù)據(jù)驅(qū)動選型,提升決策效率
查看全部API→
??
熱門場景實測,選對API
#AI文本生成大模型API
對比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力
一鍵對比試用API
限時免費