圖表:在構(gòu)建生成式 AI 用例時(shí),貴組織希望在哪些方面花費(fèi)最多的時(shí)間和資源?

開發(fā)人員想尋求一種可靠、可擴(kuò)展且經(jīng)濟(jì)高效的方式來構(gòu)建生成式 AI 應(yīng)用程序,并尋求一個(gè)可簡化實(shí)施和 LLM 選擇過程的平臺(tái)。

圖表:在選擇向量搜索引擎時(shí),貴組織的首要考慮因素是什么?

Elastic 一如既往地在以快速的創(chuàng)新步伐針對(duì)開發(fā)人員關(guān)注的這些問題提供解決方案,以支持生成式 AI 用例。

快速、大規(guī)模地推出生成式 AI 體驗(yàn)

Elasticsearch 是市場(chǎng)上下載量最大的向量數(shù)據(jù)庫,Elastic 與 Lucene 社區(qū)的深度合作使我們能夠更快地為客戶設(shè)計(jì)和交付搜索創(chuàng)新。Elasticsearch 現(xiàn)在由?Lucene 9.10?提供支持,幫助客戶通過生成式 AI 實(shí)現(xiàn)速度和規(guī)模。借助 9.10,除了其他速度提升外,用戶還能夠在多分段索引時(shí)實(shí)現(xiàn)顯著的查詢延遲改善。這僅僅是開始,未來還會(huì)有更快的速度。

我們使用 Elastic 作為向量數(shù)據(jù)庫,因?yàn)樗哂泄逃械撵`活性、可擴(kuò)展性和可靠性。Elastic 通過快速交付支持 Machine Learning 和生成式 AI 的新功能,不斷提升自己。

Peter O’Connor,Stack Overflow 平臺(tái)工程部工程經(jīng)理

為了快速實(shí)施和擴(kuò)展 RAG 工作負(fù)載,我們推出了?Elastic Learned Sparse EncodeR (ELSER)(已正式發(fā)布),這是一個(gè)易于部署、經(jīng)過優(yōu)化和后期交互的 Machine Learning (ML) 模型,適用于語義搜索。ELSER 無需微調(diào)即可提供上下文相關(guān)的搜索結(jié)果,并為開發(fā)人員提供內(nèi)置的可信解決方案,從而免去了模型選擇、部署和管理所需的時(shí)間和復(fù)雜性。

ELSER 可提高搜索相關(guān)性,同時(shí)不會(huì)降低搜索速度 — Consensus 在使用 ELSER 升級(jí)由 Elastic 提供支持的學(xué)術(shù)研究平臺(tái)時(shí),將搜索延遲降低了 75%,同時(shí)提高了準(zhǔn)確性。

將 ELSER 與 E5 嵌入模型搭配使用,可以輕松應(yīng)用多語言向量搜索。我們專門為 Elasticsearch 量身打造了優(yōu)化的 E5 工件。多語言搜索還可通過上傳多語言模型或者與 Elastic 的推理 API(例如,Cohere 的多語言模型嵌入)集成來實(shí)現(xiàn)。這些功能進(jìn)一步加速了檢索增強(qiáng)生成 (RAG),使 Elastic 成為擴(kuò)展您所構(gòu)建的創(chuàng)新生成式 AI 體驗(yàn)的關(guān)鍵基礎(chǔ)架構(gòu)。

Elastic 還致力于高效擴(kuò)展這些體驗(yàn)。8.12 版本中隨附的標(biāo)量量化改變了向量存儲(chǔ)的游戲規(guī)則。大規(guī)模的向量擴(kuò)展會(huì)導(dǎo)致搜索速度變慢。但這種壓縮技術(shù)能夠?qū)?nèi)存需求大幅縮減四倍,并幫助打包更多向量,并且在更高的尺度上,對(duì)召回的影響可以忽略不計(jì)。它將 RAG 中使用的向量搜索速度提高了一倍,同時(shí)不會(huì)犧牲精確度。結(jié)果如何?一個(gè)更精簡、更快速的系統(tǒng),可大規(guī)模削減基礎(chǔ)架構(gòu)成本。

當(dāng)您將 Elastic 的準(zhǔn)確性和速度與 Google Cloud 的強(qiáng)大功能相結(jié)合時(shí),便可構(gòu)建一個(gè)非常穩(wěn)定且極具成本效益的搜索平臺(tái),同時(shí)為用戶提供愉快的搜索體驗(yàn)。

Sujith Joseph,Cisco Systems?首席企業(yè)搜索和云架構(gòu)師

適用于 RAG 的相關(guān)度最高的搜索引擎

相關(guān)性是獲得最佳生成式 AI 體驗(yàn)的關(guān)鍵。使用 ELSER 進(jìn)行語義搜索和 BM25 進(jìn)行文本搜索,是作為?LLM 上下文檢索相關(guān)文檔的第一步。大型上下文窗口可以使用重新排序工具進(jìn)一步細(xì)化,這些工具目前已成為 Elastic Stack 的一部分。重新排序器應(yīng)用功能強(qiáng)大的 ML 模型對(duì)搜索結(jié)果進(jìn)行微調(diào),根據(jù)用戶偏好和信號(hào)將最相關(guān)的結(jié)果置于頂部。Learning to Rank (LTR)?現(xiàn)在也是 Elasticsearch 平臺(tái)的原生功能。這對(duì)于依賴于將最相關(guān)的結(jié)果作為上下文提供給 LLM 的 RAG 用例來說非常強(qiáng)大。

可以通過推理 API 和第三方提供商(如 Cohere)進(jìn)一步簡化實(shí)施。升級(jí)到我們的最新版本,以測(cè)試重新排序器對(duì)相關(guān)性的影響。

這些方法不僅能提高搜索準(zhǔn)確性(以 Consensus 為例,提高了 30%),還能幫助您快速獲得結(jié)果,從而完善 RAG 相關(guān)性和高效管理 ML 工作流。

讓模型選擇和交換變得簡單

模型選擇就如同大海撈針。事實(shí)上,我們的開發(fā)人員調(diào)查顯示,各組織的前五項(xiàng)生成式 AI 工作之一就是與 LLM 集成。這種兩難選擇不僅僅局限于為某個(gè)用例選擇開放源還是閉源 LLM,還涉及準(zhǔn)確性、數(shù)據(jù)安全性、領(lǐng)域特定性以及快速適應(yīng)不斷變化的 LLM 生態(tài)系統(tǒng)。開發(fā)人員需要一個(gè)簡單明了的工作流程來嘗試新模型,并將它們換入和換出。

Elastic 通過其開放平臺(tái)、向量數(shù)據(jù)庫和搜索引擎支持轉(zhuǎn)換器和基礎(chǔ)模型。Elastic Learned Sparse EncodeR (ELSER)?是加速 RAG 實(shí)施的可靠起點(diǎn)。

此外,Elastic 的推理 API?可為開發(fā)人員簡化代碼和多云推理管理。無論您是使用 ELSER 還是來自 OpenAI(開發(fā)人員評(píng)估和使用最多的模型)、Hugging Face、Cohere 或其他來源的嵌入來處理 RAG 工作負(fù)載,都只需一個(gè) API 調(diào)用即可確保管理混合推理部署的代碼簡潔干凈。利用推理 API,可以輕松訪問各種模型,從而找到合適的模型。與特定于領(lǐng)域的自然語言處理 (NLP) 和生成式 AI 模型的輕松集成簡化了模型管理,使您可以騰出時(shí)間專注于 AI 創(chuàng)新。

圖表:貴組織已經(jīng)使用、評(píng)估或計(jì)劃評(píng)估這些嵌入模式中的哪些模式?
圖表:貴組織正在使用或預(yù)計(jì)今后將使用哪些類型的模型?

強(qiáng)強(qiáng)聯(lián)手:完美的集成體驗(yàn)

開發(fā)人員還可以托管各種不同的轉(zhuǎn)換器模型,包括公有和私有 Hugging Face 模型。Elasticsearch 可作為整個(gè)生態(tài)系統(tǒng)的通用向量數(shù)據(jù)庫,而偏愛?LangChain?和?LlamaIndex?等工具的開發(fā)人員則可以使用我們的集成,以使用?LangChain 模板快速啟動(dòng)生產(chǎn)就緒的生成式 AI 應(yīng)用。Elastic 的開放平臺(tái)使您可以快速調(diào)整、試驗(yàn)和加速生成式 AI 項(xiàng)目。Elastic 最近還作為第三方向量數(shù)據(jù)庫加入了 On Your Data,這是一項(xiàng)用于構(gòu)建會(huì)話式助手的新服務(wù)。另一個(gè)很好的示例是 Elastic 與 Cohere 團(tuán)隊(duì)在幕后的合作,使 Elastic 成為?Cohere 嵌入的絕佳向量數(shù)據(jù)庫。

生成式 AI 正在重塑每一個(gè)組織,而 Elastic 將為這一轉(zhuǎn)型提供支持。對(duì)于開發(fā)人員而言,成功實(shí)現(xiàn)生成式 AI 的關(guān)鍵是持續(xù)學(xué)習(xí)(您見過?Elastic Search Labs?嗎?)并迅速適應(yīng)不斷變化的 AI 環(huán)境。

更多可供學(xué)習(xí)的生成式AI:

本博文所描述的任何特性或功能的發(fā)布及上市時(shí)間均由 Elastic 自行決定。當(dāng)前尚未發(fā)布的任何特性或功能可能無法按時(shí)提供或根本不會(huì)提供。

在本博文中,我們可能使用或提到了第三方生成式 AI 工具,這些工具由其各自所有者擁有和運(yùn)營。Elastic 對(duì)第三方工具沒有任何控制權(quán),對(duì)其內(nèi)容、操作或使用不承擔(dān)任何責(zé)任或義務(wù),對(duì)您使用此類工具可能造成的任何損失或損害也不承擔(dān)任何責(zé)任或義務(wù)。在 AI 工具中使用個(gè)人、敏感或機(jī)密信息時(shí),請(qǐng)務(wù)必謹(jǐn)慎。您提交的任何數(shù)據(jù)都可能用于 AI 訓(xùn)練或其他目的。Elastic 不保證您所提供信息的安全性或保密性。在使用任何生成式 AI 工具之前,您都應(yīng)自行熟悉其隱私慣例和使用條款

原文鏈接:加速生成式 AI 體驗(yàn) | Elastic Blog

上一篇:

ChatGPT 和 Elasticsearch:可以將 ChatGPT 與 Elastic 數(shù)據(jù)結(jié)合使用的插件

下一篇:

一文掌握Prompt:萬能框架+優(yōu)化技巧+常用指標(biāo)
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊(cè)

多API并行試用

數(shù)據(jù)驅(qū)動(dòng)選型,提升決策效率

查看全部API→
??

熱門場(chǎng)景實(shí)測(cè),選對(duì)API

#AI文本生成大模型API

對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)

#AI深度推理大模型API

對(duì)比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)