1.1 智譜 AI

最接近 GPTs 能力定位是智譜清言的智能體,普通用戶無(wú)代碼方式創(chuàng)建,可以上傳知識(shí)庫(kù),調(diào)用模型繪畫(huà)、聯(lián)網(wǎng)和代碼能力,同時(shí)也支持具備開(kāi)發(fā)能力的用戶接入自定義 API,完成度較高,有專門(mén)的智能體用于創(chuàng)建過(guò)程答疑,也可以根據(jù)需求描述一鍵生成智能體。

1.2 百度

文心一言的插件其實(shí)更接近 ChatGPT 前期的插件功能,因?yàn)橐彩且环N在基礎(chǔ) Chat 上的能力擴(kuò)展,所以將其放在類 GPTs 能力部分。上線自定義插件的門(mén)檻較高,需要先實(shí)名申請(qǐng)開(kāi)發(fā)者權(quán)限[1],部署插件中的功能服務(wù),然后定義 ai-plugin.json(元信息描述文件)和 openapi.yaml(API 描述文件),可選的 example.yaml(調(diào)用示例,提升插件調(diào)用正確率)、msg_content.yaml(插件動(dòng)作消息注冊(cè)文件)、uj.json(插件的 UI 組件信息)5 種文件,再按照材料審核模板,并與官方人員進(jìn)行企微溝通后[2],然后才能提交上線。

1.3 其他

其他四家暫時(shí)未在客戶端產(chǎn)品上集成類 GPTs 能力

2. 插件能力

需要注意的是,OpenAI 官方已經(jīng)計(jì)劃于 2024 年 4 月 9 日徹底停止 ChatGPT 插件測(cè)試版[3]。(2024 年 3 月 19 日將禁止使用插件創(chuàng)建新對(duì)話。在 2024 年 4 月 9 日之前,用戶還能夠繼續(xù)使用現(xiàn)有的插件對(duì)話),所以后面 ChatGPT 不再具備插件功能,因?yàn)楣俜秸J(rèn)為 GPTs 已經(jīng)覆蓋插件的能力了。

OpenAI 有自己的野心,力求減少對(duì)外部第三方服務(wù)的依賴。早期的插件測(cè)試版(plugin beta)充當(dāng)了第三方平臺(tái)與 ChatGPT 之間的橋梁,但某些插件甚至需要用戶跳轉(zhuǎn)到外部平臺(tái)以完成體驗(yàn)。相比之下,GPTs 完全在 GPT 的生態(tài)系統(tǒng)內(nèi)構(gòu)建智能體,使得 OpenAI 能夠更有效地控制和塑造其自有的技術(shù)生態(tài)。

不知道阿里和百度后續(xù)是否會(huì)跟隨調(diào)整相應(yīng)功能,但當(dāng)前官方文檔還沒(méi)看到相應(yīng)說(shuō)明。

2.1 阿里

內(nèi)置插件

靈積模型服務(wù)當(dāng)前內(nèi)置支持 5 種插件,插件 API 使用需申請(qǐng)[4]并通過(guò)后才可使用。

自定義插件

對(duì)開(kāi)發(fā)者來(lái)說(shuō),自定義插件才是剛需首先需要將包含自定義插件功能的 HTTP 服務(wù)部署好,同時(shí)將 HTTP 服務(wù)的功能匯總成 ai-plugin.json(元信息描述文件)和 openapi.yaml(API 描述文件),然后必須通過(guò)郵件?dashscope@alibabacloud.com?方式提交自定義插件,申請(qǐng)通過(guò)才能正常使用,描述文件的要求和規(guī)范可參考插件接入指引[5]。

ai-plugin.json 描述了插件的基本信息,下面是一個(gè)管理待辦事項(xiàng)的插件示例:

{
"schema_version": "v1",
"name_for_human": "待辦事項(xiàng)插件",
"name_for_model": "todo",
"description_for_human": "用于管理待辦事項(xiàng)列表的插件。您可以添加、刪除和查看您的待辦事項(xiàng)。",
"description_for_model": "用于管理待辦事項(xiàng)列表的插件。您可以添加、刪除和查看您的待辦事項(xiàng)。",
"auth": {
"type": "none"
},
"api": {
"type": "openapi",
},
"logo_url": "http://localhost:3333/logo.png",
"contact_email": "support@example.com"
}

2.2 百度

內(nèi)置插件

千帆大模型平臺(tái)同樣提供 5 種內(nèi)置插件,無(wú)需申請(qǐng),可以直接在進(jìn)行插件編排[6]時(shí)引入,然后發(fā)布插件應(yīng)用[7],即可通過(guò) API 調(diào)用。

自定義插件

需要將包含自定義插件功能的域名服務(wù)部署好,同時(shí)配置好 ai-plugin.json(元信息描述文件)和 openapi.yaml(API 描述文件),描述文件的規(guī)范可參考插件開(kāi)發(fā)者文檔[8],然后在進(jìn)行插件編排時(shí)選擇自定義插件,根據(jù)下面流程[9]進(jìn)行驗(yàn)證,安裝插件即可,最后通過(guò)插件應(yīng)用發(fā)布 API 進(jìn)行調(diào)用。

下面是百度規(guī)范中 ai-plugin.json 定義示例:

{
"schema_version": "v1",
"name_for_human": "長(zhǎng)文本理解工具",
"name_for_model": "LongtextSummary",
"description": "基于PDF/Doc格式文檔(不支持掃描件),可檢索知識(shí)點(diǎn)、對(duì)文檔進(jìn)行摘要等,支持10MB以內(nèi)文件",
"auth": {
"type": "none"
},
"api": {
"type": "openapi",
"url": "https://example.com/openapi.yaml"
},
"logo_url": "https://example.com/example-icon.png",
"contact_email": "example@baidu.com",
"legal_info_url": "https://example.com/legal"
}

2.3 其他

其他四家暫時(shí)的 API 能力暫未支持插件調(diào)用。

2.4 總結(jié)

這里需要統(tǒng)一說(shuō)下插件規(guī)范,基本都是 ai-plugin.json、openapi.yaml 兩個(gè)文件,最初的定義來(lái)自 OpenAI,大家可以前往這里[10]自行查閱完整的字段說(shuō)明,國(guó)內(nèi)各廠商對(duì)字段有修改或者定義不同,但實(shí)質(zhì)意義是一致的。還有插件標(biāo)準(zhǔn)不統(tǒng)一,增加額外工作量就十分惱火,比如我之前可以將為 OpenAI 開(kāi)發(fā)的插件直接導(dǎo)入 Semantic Kernel (大模型時(shí)代軟件開(kāi)發(fā):吳恩達(dá)提到的Semantic Kernel是什么?)和 LangChain (從零開(kāi)始學(xué)LangChain)使用,但是想直接導(dǎo)入國(guó)內(nèi)平臺(tái)使用就需要調(diào)整文件中的定義字段。

3. Assistants API

通過(guò) Assistants API 可以構(gòu)建一個(gè) Assistant,該 Assistant 可以遵從指令,使用大模型和工具調(diào)用來(lái)響應(yīng)用戶的查詢, 這里需要明確一點(diǎn) Assistants API 和 GPTs 能力的區(qū)別,來(lái)自?OpenAI 文檔[11]

特性GPTs (ChatGPT)Assistants (API)
創(chuàng)建過(guò)程無(wú)需編碼,操作簡(jiǎn)單需要編碼以便集成
運(yùn)行環(huán)境位于 ChatGPT 內(nèi)部,操作環(huán)境受限可以集成到任何產(chǎn)品或服務(wù)中,環(huán)境靈活
定價(jià)ChatGPT Plus/企業(yè)計(jì)劃中包含根據(jù)使用不同 Assistant 特性計(jì)費(fèi)
用戶界面與 ChatGPT 內(nèi)置的用戶界面為程序化使用設(shè)計(jì);可以使用游樂(lè)場(chǎng)進(jìn)行可視化
共享性內(nèi)置與他人共享 GPT 的能力無(wú)內(nèi)置共享功能
托管GPTs 由 OpenAI 托管OpenAI 不提供托管服務(wù)
工具內(nèi)置工具,如:瀏覽、DALLE、代碼解釋器、檢索、函數(shù)調(diào)用內(nèi)置工具,如:代碼解釋器、檢索和自定義操作

再說(shuō)下函數(shù)調(diào)用功能(當(dāng)調(diào)用函數(shù)時(shí), API 將在運(yùn)行過(guò)程中暫停執(zhí)行,提供的函數(shù)調(diào)用結(jié)果返回時(shí)再繼續(xù)運(yùn)行), 既可以通過(guò) Chat Completions API 直接調(diào)用,也可以通過(guò) Assistants API 方式調(diào)用,作用效果相似。OpenAI 的 assitant API 當(dāng)前只包含三種工具,不包含搜索引擎工具,但是 MiniMax 包含,所以我把完整能力分為四種工具支持。

3.1 阿里

阿里沒(méi)有 Assistants API 的概念,但是插件起到相似作用,代碼解釋器能力可以由內(nèi)置 Python 代碼解釋器插件代替,函數(shù)調(diào)用、知識(shí)庫(kù)檢索、搜索引擎功能均需要開(kāi)發(fā)者通過(guò)插件的方式[12]自行實(shí)現(xiàn),初次之外插件也具備執(zhí)行預(yù)訂酒店任務(wù),獲取實(shí)時(shí)股票、價(jià)格等實(shí)時(shí)信息能力。

3.2 百度

百度同樣沒(méi)有 Assistants API 的概念,對(duì)應(yīng)的也是由插件來(lái)支持這部分能力,內(nèi)置的知識(shí)庫(kù)插件和百度搜索、網(wǎng)頁(yè)解析插件解決了知識(shí)庫(kù)庫(kù)檢索和搜索引擎能力接入,代碼解釋器可以通過(guò)定義插件[13]來(lái)實(shí)現(xiàn),同時(shí) Chat 接口支持函數(shù)調(diào)用功能。

3.3 MiniMax

沒(méi)條件看 OpenAI 文檔的朋友,這里強(qiáng)烈推薦閱讀 MiniMax 的?Assistans API 文檔[14]?,應(yīng)該是國(guó)內(nèi)這些大模型廠商中寫(xiě)的最清晰的,而且還比 OpenAI 多支持了 Web Search(網(wǎng)絡(luò)搜索)工具,很不錯(cuò)。

3.4 智譜 AI

智譜的文檔也沒(méi)有 Assistants API 的概念,但是支持以 Chat Completions API 接口的形式進(jìn)行函數(shù)調(diào)用[15]知識(shí)庫(kù)檢索[16]、網(wǎng)絡(luò)搜索[17],暫不支持代碼解釋器功能,但是可以借助函數(shù)調(diào)用功能自定義實(shí)現(xiàn)。

3.5 MoonShot

MoonShot 當(dāng)前的API 能力[18]還十分簡(jiǎn)陋,只有一個(gè)文件內(nèi)容識(shí)別的接口接近知識(shí)庫(kù)索引,其他能力均不支持,而且也無(wú)法通過(guò)間接方式實(shí)現(xiàn),這也與他家聚焦長(zhǎng)文本,long context 有關(guān)。

3.6 百川智能

百川智能的 API 能力[19] 當(dāng)前只支持網(wǎng)絡(luò)搜索和知識(shí)庫(kù)檢索,代碼解釋器和函數(shù)調(diào)用能力還不具備,也無(wú)法通過(guò)間接方式集成。

4. 基礎(chǔ) API 能力

4.1 微調(diào)能力支持

模型微調(diào)是指通過(guò)微調(diào)工具,加入企業(yè)獨(dú)有的場(chǎng)景數(shù)據(jù),對(duì)平臺(tái)的基礎(chǔ)模型進(jìn)行微調(diào),可以幫助用戶快速定制出更符合業(yè)務(wù)場(chǎng)景需求的專屬大模型,它的優(yōu)勢(shì)在于對(duì)基礎(chǔ)模型只需進(jìn)行少量調(diào)整,就可以滿足特定的需求,相比訓(xùn)練新模型高效且低成本。

什么場(chǎng)景下適用微調(diào)

可以先嘗試調(diào)整提示詞或者使用一些工具如函數(shù)調(diào)用 、檢索功能來(lái)獲得更好的效果,若目前的基礎(chǔ)模型及相關(guān)工具無(wú)法提供滿意答案或處理復(fù)雜推理任務(wù)時(shí),可以使用微調(diào)獲得更好的效果。

微調(diào)可改善效果的典型場(chǎng)景:

微調(diào)方面,大廠支持的工具鏈豐富的多,創(chuàng)業(yè)公司就只有最基礎(chǔ)的微調(diào)接口,百川和 MoonShot 當(dāng)前還不支持,這部分功能我沒(méi)有深入體驗(yàn),只試用了微調(diào)接口

  1. 智譜 AI 的模型微調(diào)[20],需要聯(lián)系官方進(jìn)行定制
  2. MiniMax 的微調(diào)操作指南[21]
  3. 百度的模型精調(diào)[22],包括 Post-pretrain、SFT、RLHF 等環(huán)節(jié)
  4. 阿里的模型定制[23],支持 LLaMa2、ChatGLM、百川開(kāi)源模型等微調(diào)
  5. 百川智能暫不支持微調(diào)
  6. MoonShot 暫不支持微調(diào)

4.2 向量模型

測(cè)試

我的場(chǎng)景主要用于識(shí)別用戶意圖,比如用戶問(wèn)到小程序,我想將用戶意圖指向什么是獨(dú)立小程序、什么是聯(lián)營(yíng)小程序、獨(dú)立小程序怎么申請(qǐng)等問(wèn)題,我將用戶問(wèn)題與預(yù)設(shè)問(wèn)題的匹配相似度閾值設(shè)為 0.9(0.5 ~ 1.0,從容易匹配到精準(zhǔn)匹配),基本可以命中 80%以上的用戶意圖,測(cè)試下來(lái)幾家向量模型在通用場(chǎng)景下的效果差不多。

向量模型的價(jià)格

向量模型百度的更貴一點(diǎn),阿里更便宜,其他三家價(jià)格一樣。

  1. 智譜 AI 的向量模型 Embedding-2[24] 0.0005 元/千 tokens
  2. 百川智能的向量模型 Baichuan-Text-Embedding[25] 0.0005 元/千 tokens
  3. MiniMax 的向量模型 embo-01[26] 0.0005 元/千 tokens
  4. 百度千帆的向量模型 Embedding-V1[27] 0.002 元/千 tokens
  5. 阿里靈積的通用文本向量模型[28] 0.0007 元/1000 tokens
  6. MoonShot 暫不支持向量模型接口

4.3 通用大模型 API 計(jì)價(jià)對(duì)比

下面是一個(gè)價(jià)格簡(jiǎn)單比較,但是價(jià)格和模型能力強(qiáng)相關(guān),后面會(huì)有個(gè)各模型能力側(cè)重點(diǎn)說(shuō)明,可以綜合成本和效果進(jìn)行選型。

智譜的通用大模型價(jià)格

百川智能的通用大模型價(jià)格,模型能力介紹:產(chǎn)品介紹[29]

文心的大語(yǔ)言模型價(jià)格

通義千問(wèn)大語(yǔ)言模型價(jià)格

MiniMax 大語(yǔ)言模型定價(jià)

MoonShot 通用大模型定價(jià)

moonshot-v1-8k: 它是一個(gè)長(zhǎng)度為 8k 的模型,適用于生成短文本。moonshot-v1-32k: 它是一個(gè)長(zhǎng)度為 32k 的模型,適用于生成長(zhǎng)文本。moonshot-v1-128k: 它是一個(gè)長(zhǎng)度為 128k 的模型,適用于生成超長(zhǎng)文本。以上模型的區(qū)別在于它們的最大上下文長(zhǎng)度,這個(gè)長(zhǎng)度包括了輸入消息和生成的輸出,在效果上并沒(méi)有什么區(qū)別。

4.6 開(kāi)發(fā)者支持

針對(duì)小企業(yè)、創(chuàng)業(yè)公司和獨(dú)立開(kāi)發(fā),各家都有看到對(duì)應(yīng)開(kāi)發(fā)者扶持計(jì)劃,大家可以后臺(tái)回復(fù)「大模型API」獲取完整表格,里面有文章中提到的所有內(nèi)容鏈接,這里不詳細(xì)展開(kāi)了。

總結(jié)

終于來(lái)到總結(jié)部分了,我最后選用的智譜 AI 和 阿里(用作備份服務(wù)),MoonShot 的 long context 能力比較強(qiáng),但是目前 API 能力跟不上,無(wú)法在應(yīng)用上接入使用,只能在客戶端 Kimi 上用用;智譜 AI 的模型,在同等數(shù)量級(jí)參數(shù)的模型中理解能力屬于前列,安全對(duì)齊方面做的也比較出色;MiniMax 和百川智能的 API 吞吐一上來(lái),接口出錯(cuò)率比較高,模型能力相比智譜還是差點(diǎn);API 穩(wěn)定性和并發(fā)支持方面大廠還是比較穩(wěn),基本沒(méi)有接口延遲和出錯(cuò)情況出現(xiàn),兩家模型能力都中規(guī)中矩,但是通義千問(wèn)在我的測(cè)試場(chǎng)景下比文心效果好,所以選擇備份服務(wù)選了阿里的。

文檔體感

大廠只是把大模型服務(wù)作為整體云戰(zhàn)略的一部分,產(chǎn)品線很全,哪個(gè)環(huán)節(jié)都想做,但是哪部分做的都不太好,反正用起來(lái)不舒服,文檔入口的層級(jí)太深,文檔組織有些混亂,這也是我沒(méi)有去繼續(xù)測(cè)試騰訊和字節(jié)的原因。大模型創(chuàng)業(yè)公司反到?jīng)]有包袱,MiniMax 做的最好,文檔很清晰,一目了然;智譜 AI 的文檔也可以,能力也比較完整,百川和 MoonShot 當(dāng)前能夠提供的 API 能力總體較弱,文檔也沒(méi)多少內(nèi)容。

大廠大模型服務(wù)

  1. 百度

百度智能云—>產(chǎn)品—>人工智能開(kāi)發(fā)平臺(tái)—>千帆大模型平臺(tái)[30]

  1. 阿里

阿里云—>產(chǎn)品—>人工智能與機(jī)器學(xué)習(xí)—>模型平臺(tái)與服務(wù)—>模型服務(wù)靈積 DashScope[31]

  1. 字節(jié)

火山引擎—>產(chǎn)品—>人工智能與機(jī)器學(xué)習(xí)—>機(jī)器學(xué)習(xí)—>火山方舟[32]

  1. 騰訊

自己看吧,我就不浪費(fèi)時(shí)間了 ???吐槽下騰訊混元大模型的 API,不敢相信這是騰訊的水平[33]

參考資料

實(shí)名申請(qǐng)開(kāi)發(fā)者權(quán)限:?https://yiyan.baidu.com/developer[2]

按照材料審核模板,并與官方人員進(jìn)行企微溝通后: https://yiyan.baidu.com/developer/doc#Klmytk20y[3]

OpenAI 官方已經(jīng)計(jì)劃于 2024 年 4 月 9 日徹底停止 ChatGPT 插件測(cè)試版:?https://help.openai.com/en/articles/8988022-winding-down-the-chatgpt-plugins-beta[4]

申請(qǐng): https://dashscope.console.aliyun.com/plugin?spm=a2c4g.11186623.0.0.47896570Cg5Klb[5]

插件接入指引: https://help.aliyun.com/zh/dashscope/developer-reference/model-plugin-developer-guidelines[6]

插件編排: https://console.bce.baidu.com/qianfan/plugin/service/list[7]

插件應(yīng)用: https://console.bce.baidu.com/qianfan/ais/console/applicationConsole/application/create[8]

插件開(kāi)發(fā)者文檔: https://cloud.baidu.com/doc/WENXINWORKSHOP/s/2lmuqfng8[9]

流程: https://cloud.baidu.com/doc/WENXINWORKSHOP/s/wlmufm7ou[10]

前往這里: https://platform.openai.com/docs/plugins/getting-started[11]

OpenAI 文檔: https://help.openai.com/en/articles/8673914-gpts-vs-assistants[12]

通過(guò)插件的方式: https://help.aliyun.com/zh/dashscope/developer-reference/model-plugin-quick-start[13]

定義插件: https://cloud.baidu.com/doc/WENXINWORKSHOP/s/2lmuqfng8[14]

Assistans API 文檔: https://www.minimaxi.com/document/guides/Assistants/operate?id=6586b8674da4834fd75906e7[15]

函數(shù)調(diào)用: https://open.bigmodel.cn/dev/howuse/functioncall[16]

知識(shí)庫(kù)檢索: https://open.bigmodel.cn/dev/howuse/retrieval[17]

網(wǎng)絡(luò)搜索: https://open.bigmodel.cn/dev/api#glm-3-turbo[18]

API 能力: https://platform.moonshot.cn/docs/api-reference[19]

API能力: https://platform.baichuan-ai.com/docs/api[20]

模型微調(diào): https://open.bigmodel.cn/dev/howuse/finetuning[21]

微調(diào)操作指南: https://www.minimaxi.com/document/guides/Finetune/example?id=657c2bce24432923d556b455[22]

模型精調(diào): https://cloud.baidu.com/doc/WENXINWORKSHOP/s/6lomkz7hw[23]

模型定制: https://help.aliyun.com/zh/dashscope/developer-reference/quick-start-17?spm=a2c4g.11186623.0.i16[24]

向量模型Embedding-2: https://open.bigmodel.cn/dev/api#text_embedding[25]

向量模型Baichuan-Text-Embedding: https://platform.baichuan-ai.com/docs/text-Embedding[26]

向量模型embo-01: https://www.minimaxi.com/document/price?id=6433f32294878d408fc8293e[27]

向量模型Embedding-V1: https://cloud.baidu.com/doc/WENXINWORKSHOP/s/alj562vvu[28]

通用文本向量模型: https://help.aliyun.com/zh/dashscope/developer-reference/text-embedding-quick-start?spm=a2c4g.11186623.0.0.79c1696bpdIAHh[29]

產(chǎn)品介紹: https://www.baichuan-ai.com/home[30]

千帆大模型平臺(tái): https://cloud.baidu.com/product/wenxinworkshop.html?track=1031b[31]

模型服務(wù)靈積DashScope: https://dashscope.aliyun.com/[32]

火山方舟: https://www.volcengine.com/product/ark[33]

吐槽下騰訊混元大模型的 API,不敢相信這是騰訊的水平:?https://www.v2ex.com/t/975832

文章轉(zhuǎn)自微信公眾號(hào)@莫爾索隨筆

上一篇:

Salesforce元數(shù)據(jù)API開(kāi)發(fā)指南

下一篇:

GitLabAPI工具類的深入使用和實(shí)現(xiàn)
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊(cè)

多API并行試用

數(shù)據(jù)驅(qū)動(dòng)選型,提升決策效率

查看全部API→
??

熱門(mén)場(chǎng)景實(shí)測(cè),選對(duì)API

#AI文本生成大模型API

對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)

#AI深度推理大模型API

對(duì)比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)