
大模型上下文協(xié)議與Spring開發(fā)集成篇——mcp-spring-webmvc原理
1960s 后的歷次技術變遷以及代表公司
至于為什么認為當下是參與 AI 的重要時點,Pat Grady 提到,紅杉從創(chuàng)立以來見證了歷史上的數(shù)次技術變遷、也受益于此,在這個過程中,團隊也對于不同技術浪潮之間如何互相影響、推動世界向前發(fā)展有著清晰的認知:
? 1960s:紅杉創(chuàng)始人 Don Valentine 在仙童半導體負責市場營銷,“硅谷”這一名字的由來也和仙童半導體的硅基晶體管直接相關;
? 1970s:在芯片基礎上,人們構建出了計算機系統(tǒng);
? 1980s:網(wǎng)絡技術把 PC 連接到一起,與此同時軟件產(chǎn)業(yè)誕生;
? 1990s:互聯(lián)網(wǎng)誕生,人們的通信和消費方式因此被改變;
? 2000s:互聯(lián)網(wǎng)已經(jīng)逐步成熟,開始能夠支持復雜的應用程序,云計算出現(xiàn);
? 2010s:因為移動設備的普及,移動互聯(lián)網(wǎng)時代到來,再次改變了我們的工作方式。
每一次技術浪潮都是在前一次的基礎上疊加和演進的。AI 的概念雖然早在 20 世紀 40 年代就已出現(xiàn),但直到最近幾年 AI 才從想法和夢想變?yōu)楝F(xiàn)實,開始商業(yè)化,并在人們?nèi)粘I钪薪鉀Q實際問題,實現(xiàn)這個突破的前提包括:
? 低價且充足的算力;
? 快速且高效可靠的網(wǎng)絡;
? 智能手機在全球的普及;
? 由 Covid 加速的在線化趨勢;
? 上述這些過程中都為 AI 帶來了大量數(shù)據(jù)。
Pat Grady 認為,AI 將會成為未來 10-20 年的主題,紅杉對此有強烈的信念,盡管這個假設還有待證實。
從 Cloud 和 Mobile 到 AI 時代的代表性公司
關于 AI 未來的行業(yè)格局,Pat Grady 先總結(jié)了 Cloud 和 Mobile 時代出現(xiàn)的收入超過 10 億美元的公司(如上圖左側(cè)),雖然 AI 代表的最右側(cè)現(xiàn)在幾乎還是空白,但也象征在當前市場中巨大的的潛在價值和機會。Pat Grady 預測,在未來的 10-15 年,右邊的空白就會被 40-50 個新的公司 logo 填滿,正是讓他們感到興奮的機會所在。
紅杉合伙人 Sonya Huang 首先從客戶服務、法律、編程和視頻生成等領域回顧了過去一年 AI 的發(fā)展。
AI 應用的各個領域
2023 年是 AI 歷史上相當重要的一年。ChatGPT 問世的一年半后,整個行業(yè)一直發(fā)生著劇烈的變化。去年大家討論的還是 AI 將如何徹底改變不同領域并提供驚人的生產(chǎn)力提升,而現(xiàn)在 AI 已經(jīng)成為人們關注的焦點。
Klarna CEO Sebastian Siemiatkowski X 推文
在客服領域,Klarna?的 CEO Sebastain 曾經(jīng)公開表示,現(xiàn)在 Klarna 已經(jīng)在用 OpenAI 來處理 2/3 的客服查詢,AI 替代了相當于 700 名全職客服的工作。目前全球有數(shù)千萬的 call center agent,結(jié)合這一背景下,Sonya 認為 AI 已經(jīng)在客服市場找到了 PMF。
法律服務在一年前被認為是最不愿擁抱科技、最不愿意承擔風險的行業(yè),現(xiàn)在已經(jīng)出現(xiàn)了像?Harvey?這樣的公司,可以把律師從日常 paperword 到高級分析的很多工作自動化。
再比如在編程領域,經(jīng)過一年時間,我們已經(jīng)從一年前用 AI 寫代碼發(fā)展快速發(fā)展到擁有獨立的 AI 軟件工程師。還有像 HeyGen 這樣的 AI 視頻生成公司,能幫人生成 Avatar 參與 Zoom 會議。
Sequoia 的 Pat Grady 用 HeyGen 生成的 Avatar?
在 Zoom 會議中的影像呈現(xiàn)
AI 和 SaaS 收入增速對比
根據(jù)估算,GenAI 在出現(xiàn)后一年間創(chuàng)造的總收入約為 30 億美元,這還不包括科技巨頭和云服務廠商通過 AI 產(chǎn)生的收入。作為對比,SaaS 花了近 10 年才達到這個水平。也正是因為這樣的速度和規(guī)模讓大家更確信 GenAI 會持續(xù)存在。
主要 GenAI 產(chǎn)品的實際用戶規(guī)模
從上圖也可以看出,客戶對 AI 需求不僅限于一兩個應用,而是方方面面的。很多人都知道 ChatGPT 有多少用戶,但當在觀察許多 AI 應用的收入和使用數(shù)據(jù)時,會發(fā)現(xiàn)現(xiàn)在不管是 to B 還是 to C,初創(chuàng)公司還是已有的科技公司,很多 AI 產(chǎn)品都在各個行業(yè)找到了合適的 PMF,應用場景已經(jīng)非常多樣化。
foundation model 和應用層的融資占比
從投資分布上來看,資金分配不均衡是一個顯著問題。如果把 GenAI 比作一個蛋糕,蛋糕底層是 foundation model ,中間是開發(fā)者工具和?infra,頂層是應用。一年前,人們的預期是:因為 foundation model 層的進步,所以應用層會涌現(xiàn)出大量新公司。但實際情況卻相反。越來越多的 foundation model 公司出現(xiàn)并融到了大量資金,而應用層似乎才剛剛起步。
紅杉美國合伙人 David 在去年發(fā)表了一篇?AI’s $200 Billion Question?的討論。如果我們看目前投入到 GPU 上的投資,去年只是在?Nvidia 的芯片上就花了大概 500 億美元,但目前可以確認的 AI 行業(yè)收入只有 30 億美元。這些數(shù)據(jù)表明, AI 產(chǎn)業(yè)目前還處于很早期的階段,投入產(chǎn)出比很低,還有很多現(xiàn)實問題需要解決。
AI 產(chǎn)品和移動應用的 MAU、DAU 和次月留存率
盡管 AI 產(chǎn)品的用戶數(shù)量和收入看起來很可觀,但它在 DAU、MAU 和次月留存率方面還遠低于移動應用。很多用戶都在用戶調(diào)研中提到 AI 應用的預期與體驗之間存在差距。還有一些產(chǎn)品 demo 看起來很炫酷,實際用起來卻不怎么樣,這也導致用戶沒有能更長期使用下去。
基礎模型能力提升
這些雖然是客觀存在的問題,但更是機遇。去年企業(yè)對 GPU 的大量投資帶來了更加智能的 foundation model,最近出現(xiàn)的?Sora、Claude-3 和 Grok 等都顯示出 AI 的基準智能水平正在提高,因此未來 AI 產(chǎn)品的 PMF 將加速提升。
iPhone 和 App Store 的發(fā)展演變
新技術從出現(xiàn)到成熟需要一個過程,開創(chuàng)性應用的出現(xiàn)同樣需要時間。以 iPhone 為例,App Store 初期的許多應用都很原始,只是展示新技術,并沒有真正解決問題或創(chuàng)造價值。像手電筒或者類似 beer drinking 這種小游戲,后來都變成了系統(tǒng)內(nèi)置應用或者可有可無的小工具。而 Instagram 和 Doordash 這樣真正具有影響力的應用都是在 iPhone 和 App Store 推出幾年后才出現(xiàn)的。
AI 技術正在經(jīng)歷類似的發(fā)展過程?,F(xiàn)在市場上的許多 AI 應用都還處于 demo 或早期探索階段,就像 App Store 的早期應用一樣,但也許下一代的傳奇公司已經(jīng)出現(xiàn)。
AI 的應用場景已經(jīng)非常廣泛,其中 AI 客戶支持、AI Friendship(AI 虛擬陪伴)?和企業(yè)知識是非常典型的三個領域??头堑谝慌谄髽I(yè)中真正實現(xiàn)產(chǎn)品 PMF 的 AI 應用場景之一。Klarna 不是一個例外,而是一個普遍趨勢。AI friendship 是 AI 最令人驚喜的應用場景之一,它的用戶數(shù)量和使用指標表明,用戶對此有著強烈的喜愛。此外,跨部門、跨職能的企業(yè)內(nèi)部知識共享(Horizontal enterprise knowledge)應用也有很大的潛力。
基于以上的分析,紅杉的幾位合伙人也對 2024 年的 AI 發(fā)展做出了預測。
? 預測一:Copilot 將逐漸向 AI Agent 轉(zhuǎn)變。
2024 年,AI 將從輔助人類的 Copilot 轉(zhuǎn)變?yōu)檎嬲芴娲恍┤祟惞ぷ鞯?Agent。AI 將更像是一個同事,而不僅僅是一個工具,這點在軟件工程、客服等行業(yè)已經(jīng)初步顯現(xiàn)。
? 預測二:模型將具備更強的規(guī)劃和推理能力。
很多人批評 LLM 只是重復以往數(shù)據(jù)中的統(tǒng)計模式,而非真正地進行深入的思考和邏輯推理,這種狀況將會通過新的研究方向得到改善。一些研究正在嘗試讓模型更好地進行推理環(huán)節(jié)計算和游戲式價值迭代(gameplay-style value iteration),這些方法可以讓模型在做出決策前有一定的“思考時間”,這些嘗試預計將在明年讓 AI 更有能力執(zhí)行更高級別的認知任務,例如規(guī)劃和推理。
游戲式價值迭代(gameplay-style value iteration)是從強化學習領域借鑒來的一個概念,指模型能夠評估不同行動的長期價值,并根據(jù)這些價值來計劃未來的行動,類似于下棋或玩游戲時的策略思考。
? 預測三:LLM 準確度將更高,從主要用于從 To-C 娛樂應用逐漸擴展到企業(yè)級應用。
在 To-C 應用場景中,用戶對于 AI 出現(xiàn)錯誤這件事并不會特別在意,因為人們主要用 AI 來進行娛樂,但當 AI 用于企業(yè)應用,尤其是在醫(yī)療、國防等高風險領域時,準確性和可靠性就變得至關重要。研究者正在開發(fā) RLHF、Prompt Training 和向量數(shù)據(jù)庫等各種工具和技術,來幫助 LLM 實現(xiàn)“五個九”(99.999% 的正常運行時間)的高準確度和可靠性。
? 預測四:大量 AI Prototype 和實驗項目將投入使用。
2024 年預計將有許多 AI 原型和實驗項目進入市場。和實驗階段不同,產(chǎn)品真正開始被用戶使用時,就需要考慮延遲時間、成本、模型所有權以及數(shù)據(jù)所有權的管理等一系列因素,這也意味著計算的重心預計將從預訓練轉(zhuǎn)向推理過程。因此 2024 年是極為關鍵的一年,人們對這些產(chǎn)品有很高期待,必須確保這個轉(zhuǎn)變過程正確無誤。
? 判斷 1:AI 是一次規(guī)模宏大的成本驅(qū)動型生產(chǎn)力革命。
技術革命有很多種類型,包括電話帶來的通信革命、火車帶來的交通革命以及農(nóng)業(yè)機械化帶來的生產(chǎn)力革命。AI 帶來的顯然是一場生產(chǎn)力革命。
歷史上的生產(chǎn)力革命都有相似的模式:起初是人使用工具,然后發(fā)展到人配合機器,最終轉(zhuǎn)變?yōu)槿祟惻c協(xié)同化、網(wǎng)絡化的工具協(xié)作。這表明 AI 的發(fā)展將經(jīng)歷從單點逐漸進化到高度集成網(wǎng)絡的過程,這將極大改變我們的工作和生產(chǎn)方式。
歷史上從鐮刀到聯(lián)合收割機的變化
在農(nóng)耕領域,人類使用鐮刀這一工具至今已經(jīng)超過 1 萬年,再到 1831 年發(fā)明的機械收割機,如今我們已經(jīng)擁有由數(shù)以萬計的機器系統(tǒng)組成的復雜網(wǎng)絡聯(lián)合收割機,系統(tǒng)中的單個機器就是 Agent。
在知識工作和寫作領域也有類似的模式。知識工作最初的工具只有紙筆,發(fā)展到后來的編程,再到現(xiàn)在計算機和 IDE 已經(jīng)可以大規(guī)模輔助軟件開發(fā)。軟件開發(fā)將不再是孤立的過程,而是一系列的機器網(wǎng)絡協(xié)同構建復雜的工程系統(tǒng),由多個 Agent 共同完成代碼生成。
寫作曾經(jīng)也是純?nèi)斯さ?,后來人與機器助手協(xié)作,現(xiàn)在已經(jīng)可以利用很多個工具協(xié)同。比如大家現(xiàn)在使用的 AI 助手不僅僅是 GPT-4,還有 Mistral-Large 和 Claude-3 等工具,并且借助他們互相驗證,獲得更好的答案。
AI 帶來各行業(yè)成本普遍下降
生產(chǎn)力革命對社會的影響是普遍和深遠的。從經(jīng)濟學角度來說,這意味著成本能顯著降低。上圖顯示 S&P 500 公司每 100 萬收入所需的員工數(shù)量正在迅速下降,這種變化意味著我們將能以更快的速度和更少的人力來完成工作。但這并不意味著我們要做的事情變少了,而是在同樣的時間能做更多的事。
歷史上各領域的技術進步都會帶來通縮。以計算機軟件為例,由于持續(xù)的技術創(chuàng)新,軟件的價格在不斷下降。但在對社會最重要的領域,比如教育、醫(yī)療保健、住房等,價格上漲速度卻遠遠超過通脹,而 AI 恰好有助于降低這些領域的成本。
因此,關于 AI 長期影響的第一個關鍵判斷是:AI 將是一次巨大的成本驅(qū)動型生產(chǎn)力革命,幫助我們在社會的關鍵領域以更少的資源做更多的事。
? 判斷2:萬物皆可生成
第二個判斷主要是討論 AI 到底能做什么。
一年前 Jensen Huang 提出了一個預言,未來圖像將不再是渲染出來的,而是生成出來的。這意味著我們正在從將信息存儲為像素矩陣,轉(zhuǎn)變?yōu)閷⑵浔硎緸槎嗑S概念。以字母“a”為例,過去“a”都是以 ASCII 碼 97 這個原始數(shù)據(jù)被存儲,但現(xiàn)在計算機不再只關注像素表示,而是理解字母作為英文字母在特定語境下的概念內(nèi)涵。
更強大的是,計算機不僅能夠理解這種多維表示并渲染為圖像,還能夠把它情境化,理解“a”作為英文字母在特定語境下的含義,而不僅僅是孤立的符號。比如看到“multidimensional”這個詞,計算機不會去關注“a”這個字母本身,而是去理解整個語境和詞的含義。
這個過程正是人類思維的核心特征。就像我們學習字母“a”時并不是記憶像素矩陣,而是掌握了一個抽象概念。這種思維方式可以追溯到 2500 年前柏拉圖的理念論,柏拉圖認為,萬物背后都有一個永恒不變的理念世界,現(xiàn)實世界中的事物都是理念世界完美形式的映射,這與當前 AI 的學習過程有相通之處。
而這件事對于企業(yè)的影響是很大的。目前企業(yè)已經(jīng)開始將 AI 集成到特定的流程和 KPI 制定中,例如前面提到的 Klarna 借助 AI 提高了客戶支持相關的績效,通過建立 AI 檢索信息體系打造優(yōu)質(zhì)的客戶體驗。這種變革也伴隨著新用戶界面的出現(xiàn),這些用戶界面可能與以往我們所用的支持溝通方式截然不同。
這個趨勢相當重要,因為這意味著企業(yè)最終可能會像神經(jīng)網(wǎng)絡那樣運作,各個部分之間相互連接和協(xié)同工作,以自我優(yōu)化的方式互相學習和適應并不斷提高效率。
以客戶支持流程為例,上圖是一個簡易客服流程示意圖。客服部門有一系列 KPI,這些指標受到文生語音、語言生成、客戶個性化等因素的影響,這些因素形成了優(yōu)化項樹狀圖中的子模式或子樹,最終形成一個層次明晰、互相連通的體系圖,其中語言生成的反饋將直接影響服務客戶的最終 KPI。借助這種抽象方式,整個客服流程將由神經(jīng)網(wǎng)絡管理、優(yōu)化和改進。
再考慮企業(yè)獲客的情況。通過語言生成、增長引擎以及廣告定制和優(yōu)化等 AI 技術,可以幫助企業(yè)更好地滿足每位客戶的需求。這些技術之間的相互作用,可以推動企業(yè)像神經(jīng)網(wǎng)絡一樣自我學習和適應。個體將能夠完成更多工作,這也會催生更多一人公司出現(xiàn)。
文章轉(zhuǎn)自微信公眾號@海外獨角獸