
如何快速實(shí)現(xiàn)REST API集成以優(yōu)化業(yè)務(wù)流程
論文地址:https://arxiv.org/pdf/2311.09210.pdf
檢索增強(qiáng)語言模型(RALM)已成為自然語言處理中一種強(qiáng)大的新范式。通過將大型預(yù)訓(xùn)練語言模型與外部知識(shí)檢索相結(jié)合,RALM可以減少事實(shí)錯(cuò)誤和幻覺,同時(shí)注入最新知識(shí)。然而,目前的RALM面臨以下幾個(gè)關(guān)鍵挑戰(zhàn):
? ? ? ?為了解決這些問題,騰訊人工智能實(shí)驗(yàn)室的研究人員在他們的論文《CHAIN-OF-NOTE: ENHANCING ROBUSTNESS IN RETRIEVAL-AUGMENTED LANGUAGE MODELS》中提出了一個(gè)新的框架,稱為筆記鏈(CON)。
筆記鏈的關(guān)鍵思想是通過對(duì)檢索到的每個(gè)文檔進(jìn)行總結(jié)和評(píng)估,讓模型生成閱讀筆記,然后再生成最終的回應(yīng)。此記錄過程可以增強(qiáng)模型的以下能力:
具體而言,給定一個(gè)問題和k個(gè)檢索到的文檔,“筆記鏈”會(huì)進(jìn)行如下操作:
這種方法反映了人類的推理——將問題分解為更小的步驟。筆記為模型的思維過程提供了透明度,并提高了其噪聲和未知穩(wěn)健性。
筆記鏈生成的筆記可分為三類:
? ? ? ?該系統(tǒng)允許模型在直接檢索信息、進(jìn)行推斷和承認(rèn)其局限性之間取得平衡。
筆記鏈(CON)框架根據(jù)檢索到的文檔與輸入問題的相關(guān)性生成三種類型的閱讀筆記。以下是每種類型的筆記的示例:
輸入問題:“法國首都是什么?”
檢索文件:一篇討論法國各個(gè)城市的文章。
生成的筆記:“正如文章中所提到的,法國的首都是巴黎?!?/p>
最后回應(yīng):“法國首都是巴黎。”
輸入問題:“光合作用是如何工作的?”
檢索文件:解釋植物生物學(xué)基礎(chǔ)的文本,不直接涉及光合作用。
生成筆記:“雖然該文件沒有直接解釋光合作用,但它提供了有關(guān)植物生物學(xué)的有用信息,表明光合作用是植物將光轉(zhuǎn)化為能量的過程。”
最后回應(yīng):“光合作用是植物將光轉(zhuǎn)化為能量的過程,包括葉綠素對(duì)光的吸收以及二氧化碳和水轉(zhuǎn)化為葡萄糖和氧氣。”
輸入問題:“量子計(jì)算的最新進(jìn)展是什么?”
檢索文檔:一篇討論經(jīng)典計(jì)算技術(shù)的文章。
生成的筆記:“檢索到的文檔不包括量子計(jì)算,而是專注于經(jīng)典計(jì)算技術(shù)。該模型缺乏足夠的信息來根據(jù)此文檔進(jìn)行回答?!?/p>
最終回應(yīng):“未知,因?yàn)楝F(xiàn)有文件沒有提供量子計(jì)算最新進(jìn)展的相關(guān)信息。”
這些例子說明了CON框架如何處理不同類型的文檔:直接使用相關(guān)文檔中的信息,從上下文有用的文檔中推斷答案,并承認(rèn)知識(shí)或無關(guān)信息中的差距。
為了訓(xùn)練一個(gè)模型來生成閱讀筆記,騰訊團(tuán)隊(duì)執(zhí)行如下步驟:
在幾個(gè)QA數(shù)據(jù)集的實(shí)驗(yàn)表明:
讓我們通過一個(gè)示例來了解筆記鏈的作用:
問題:《死侍2》是什么時(shí)候上映的?
文檔1:討論2018年6月1日在美國上映的《死侍2》。
文檔2:提及《死侍2》于2018年5月10日首播,日期變更后于2018年8月18日上映。
標(biāo)準(zhǔn)RALM:2018年6月1日?
帶筆記鏈的RALM:
文檔1筆記:猜測(cè)《死侍2》于2018年6月1日在美國上映。
文檔2筆記:明確實(shí)際發(fā)布日期為2018年5月18日。
回復(fù):根據(jù)Doc 2,答案為2018年5月18日?
這展示了筆記鏈如何仔細(xì)分析文件,并確定最相關(guān)、最可信的細(xì)節(jié),以產(chǎn)生正確的回應(yīng)。
參考文獻(xiàn):
[1] https://ai.plainenglish.io/unlocking-the-black-box-how-chain-of-note-brings-transparency-to-retrieval-augmented-models-rag-ae1ebb007876
[2]?https://arxiv.org/pdf/2311.09210.pdf、
本文章轉(zhuǎn)載微信公眾號(hào)@ArronAI
對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力
一鍵對(duì)比試用API 限時(shí)免費(fèi)