SOP定義了社會中的工作角色和工作流程。在軟件工程中,瀑布模型(Waterfall Model)概述了從分析到交付的步驟,促進(jìn)了跨角色的團(tuán)隊合作。MetaGPT的方法展示了其將高級任務(wù)分解為由不同角色(產(chǎn)品經(jīng)理、架構(gòu)師、項目經(jīng)理、工程師、質(zhì)量工程師)處理的、詳細(xì)可行性組件的能力,從而促進(jìn)了角色特定的專業(yè)知識和協(xié)調(diào)。該圖說明了MetaGPT如何設(shè)計來處理復(fù)雜任務(wù)并促進(jìn)清晰的角色劃分,使其成為復(fù)雜軟件開發(fā)場景中的有價值的工具。

MetaGPT框架

MetaGPT的設(shè)計分為兩個層次:基礎(chǔ)組件層和協(xié)作層。

基礎(chǔ)組件層

基礎(chǔ)組件層以AI Agent為核心,提供了觀察、思考等能力。其建立了個體智能體操作和在系統(tǒng)范圍內(nèi)進(jìn)行信息交換所需的核心模塊,包括環(huán)境、記憶、角色、行動和工具,如圖2所示。

這一層為智能體在分配的角色中運行提供了基礎(chǔ)設(shè)施,使它們可以相互交互并與系統(tǒng)交互。

協(xié)作層

其建立在基礎(chǔ)組件層的基礎(chǔ)上,協(xié)調(diào)各個智能體共同解決復(fù)雜問題。其提供了兩種基本機制:知識共享和封裝工作流程。

在這個框架中,MetaGPT中的智能體能力得到了顯著增強。智能體的實例化,由專門的角色提示引導(dǎo),被稱為”錨定智能體”,為角色提供了觀察、思考、反思和知識積累的能力。這些角色通過已建立的訂閱和發(fā)布方法與環(huán)境進(jìn)行交互。

基礎(chǔ)和協(xié)作層的分離有利于實現(xiàn)模塊化,同時確保智能體的個人和集體能力?;A(chǔ)組件提供了可重用的構(gòu)建模塊和工具,而協(xié)作模塊則實現(xiàn)了有目的的協(xié)調(diào)。

基礎(chǔ)和協(xié)作層的劃分促進(jìn)了模塊化,同時確保了個體和集體代理的能力。組件提供了可重用的構(gòu)建塊和實用程序,而協(xié)作模塊整合了有目的的協(xié)調(diào)。

MetaGPT實現(xiàn)機制

角色定義

MetaGPT框架支持創(chuàng)建各種專業(yè)類的角色,如產(chǎn)品經(jīng)理、架構(gòu)師等?;A(chǔ)角色類由一組關(guān)鍵屬性定義:名稱、簡介、目標(biāo)、約束和描述。目標(biāo)表示角色尋求完成的主要責(zé)任或目標(biāo)。約束表示角色在執(zhí)行行動時必須遵循的限制或原則。約束可以規(guī)定如下:“你編寫的代碼應(yīng)符合PEP8等代碼規(guī)范,具有模塊化、易于閱讀和維護(hù)的特點”。描述提供了額外的具體信息,以幫助建立更全面的角色定義。

MetaGPT框架提供的全面角色定義使得其可以創(chuàng)建高度專業(yè)化的基于LLM的智能體,每個智能體都針對特定的領(lǐng)域和目標(biāo)進(jìn)行了定制。角色定義不僅引入了基于預(yù)期功能的行為指導(dǎo),而且有助于創(chuàng)建多樣化和專業(yè)化的智能體,每個智能體都是其領(lǐng)域的專家。

實例化SOP的Prompt

MetaGPT使用提示(Prompt)將現(xiàn)實世界的標(biāo)準(zhǔn)作業(yè)程序(SOP)轉(zhuǎn)化為明確定義的智能體工作流。該過程涉及使用提示來實例化SOP,并基于已建立的實踐提供逐步指導(dǎo),確保復(fù)雜序列任務(wù)的一致和結(jié)構(gòu)化執(zhí)行。

首先,我們詳細(xì)介紹Action類,然后展示了如何設(shè)計標(biāo)準(zhǔn)化行動級別細(xì)粒度提示。在MetaGPT框架中,Action作為智能體執(zhí)行特定任務(wù)的原子單位,通過自然語言進(jìn)行指定。關(guān)鍵屬性包括:

標(biāo)準(zhǔn)化輸出的行動

MetaGPT實例化工作流的有效性在很大程度上依賴于每個行動的標(biāo)準(zhǔn)化輸出。這些輸出利用專家領(lǐng)域知識和行業(yè)最佳實踐,將工作流程調(diào)整到特定的角色和上下文中。結(jié)構(gòu)化輸出設(shè)計具有以下目的:

標(biāo)準(zhǔn)化的輸出保障了一致的LLM結(jié)果,這些結(jié)果是可預(yù)測、可重復(fù)的,并符合智能體的責(zé)任范圍。它們通過設(shè)定輸出期望來引導(dǎo)高質(zhì)量、結(jié)構(gòu)化和基于任務(wù)的特定LLM生成。

此外,標(biāo)準(zhǔn)化的模式充當(dāng)了藍(lán)圖,將LLM行為限制在適合角色的邊界內(nèi)。同時,這有助于保持對目標(biāo)任務(wù)的關(guān)注,防止偏離目標(biāo)。由于行動是綜合角色基準(zhǔn)指南的一部分,這種角色意識的引導(dǎo)確保輸出與真實世界的質(zhì)量標(biāo)準(zhǔn)相一致。

總之,在MetaGPT中標(biāo)準(zhǔn)化輸出設(shè)計和實現(xiàn)為處理復(fù)雜任務(wù)提供了強大的工具。將自然語言中定義的復(fù)雜任務(wù)轉(zhuǎn)化為標(biāo)準(zhǔn)化輸出促進(jìn)了協(xié)作的一致性,從而減少了可能導(dǎo)致不連貫的多輪對話交互。此外,它可以清晰、一致地表示結(jié)構(gòu)信息,這在僅通過自然語言傳達(dá)時可能存在困難,特別是對于基于LLM的智能體。此外,通過提供結(jié)構(gòu)化和標(biāo)準(zhǔn)化的輸出,不同的智能體可以清晰地對其任務(wù)和責(zé)任達(dá)成一致的理解。

知識共享機制和自定義知識管理

在MetaGPT中,每個智能體通過從共享環(huán)境日志中檢索相關(guān)歷史信息,來主動策劃個性化知識。智能體不是被動地依賴對話,而是利用基于角色的興趣來提取相關(guān)信息。

如前所述,MetaGPT中的每個智能體都維護(hù)了一個內(nèi)存緩存,并對其角色相關(guān)的訂閱消息進(jìn)行索引,實現(xiàn)個性化的知識策劃。具體來說,消息的集中復(fù)制創(chuàng)建了一個統(tǒng)一的數(shù)據(jù)源。智能體可以注冊訂閱,自動從該數(shù)據(jù)源接收與其角色相關(guān)的消息。在內(nèi)部,智能體通過內(nèi)容、來源和屬性將內(nèi)存緩存索引,以便在相關(guān)上下文中實現(xiàn)快速檢索。

通過在智能體角色周圍對信息流進(jìn)行組織,確保多智能體之間的協(xié)作。通過結(jié)合中心化的知識共享與基于角色的個性化內(nèi)存緩存相結(jié)合,實現(xiàn)定制化的知識管理。這減少了無關(guān)數(shù)據(jù)的存在,并提供了共同的上下文,從而在團(tuán)隊協(xié)作和個人效率之間達(dá)成平衡。

MetaGPT優(yōu)劣勢

優(yōu)勢

劣勢

MetaGPT體驗

準(zhǔn)備工作

可訪問OpenAI的服務(wù)器或者本地電腦。

由于需要調(diào)用OpenAI API,因此需要提前準(zhǔn)備好OPENAI_API_KEY。

安裝MetaGPT

python --version

git clone https://github.com/geekan/MetaGPT.git
cd MetaGPT
pip3 install -e. # 或者 pip3 install metagpt # 安裝穩(wěn)定版本

?3、在config/key.yaml文件中配置OPENAI_API_KEY。

# 拷貝配置文件config.yaml為key.yaml并進(jìn)行如下修改
cp config/config.yaml config/key.yaml
變量名config/key.yaml
OPENAI_API_KEY # 用您自己的密鑰替換OPENAI_API_KEY: “sk-…”
OPENAI_API_BASE # 可選OPENAI_API_BASE: “https:///v1”

??4、(可選)如果想在執(zhí)行過程中保存像象限圖、系統(tǒng)設(shè)計、序列流程等圖表這些產(chǎn)物,可以先安裝mermaid-js

# 如果執(zhí)行,確保您的系統(tǒng)上安裝了 NPM。并使用npm安裝mermaid-js。
npm --version
sudo npm install -g @mermaid-js/mermaid-cli

? 5、開始使用。

python startup.py "寫一個命令行貪吃蛇"

# 開啟code review模式會花費更多的金錢, 但是會提升代碼質(zhì)量和成功率
python startup.py "寫一個命令行貪吃蛇" --code_review True`

運行腳本后,您可以在 workspace/ 目錄中找到您的新項目。

本文章轉(zhuǎn)載微信公眾號@深度學(xué)習(xí)自然語言處理

上一篇:

2025年值得入坑AIAgent的五大框架

下一篇:

2025年AIAgent開發(fā)框架怎么選?
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊

多API并行試用

數(shù)據(jù)驅(qū)動選型,提升決策效率

查看全部API→
??

熱門場景實測,選對API

#AI文本生成大模型API

對比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個渠道
一鍵對比試用API 限時免費

#AI深度推理大模型API

對比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個渠道
一鍵對比試用API 限時免費