最近,開(kāi)源中國(guó) OSCHINA、Gitee 與 Gitee AI 聯(lián)合發(fā)布了《2024 中國(guó)開(kāi)源開(kāi)發(fā)者報(bào)告》。
報(bào)告聚焦 AI 大模型領(lǐng)域,對(duì)過(guò)去一年的技術(shù)演進(jìn)動(dòng)態(tài)、技術(shù)趨勢(shì)、以及開(kāi)源開(kāi)發(fā)者生態(tài)數(shù)據(jù)進(jìn)行多方位的總結(jié)和梳理。
在第二章《TOP 101-2024 大模型觀點(diǎn)》中,廣東智用人工智能應(yīng)用研究院擔(dān)任工業(yè) & 社區(qū) CTO 張善友認(rèn)為,AI Agent 逐漸成為 AI 應(yīng)用的核心架構(gòu),通過(guò)自主感知、決策和執(zhí)行能力,實(shí)現(xiàn)對(duì)現(xiàn)有軟件的智能化改造和升級(jí),從而改變業(yè)務(wù)流程和用戶交互方式。
全文如下:
AI Agent 逐漸成為 AI 應(yīng)用的核心架構(gòu)
隨著人工智能技術(shù)的迅猛發(fā)展,大模型應(yīng)用已經(jīng)成為了 2024 年的熱點(diǎn)話題,大模型應(yīng)用已逐漸從初期的 Chatbot 邁向 RAG、Copilot 及 Agent 等更為高級(jí)的階段。這些大模型具備強(qiáng)大的數(shù)據(jù)處理能力和深度學(xué)習(xí)能力,為各種應(yīng)用場(chǎng)景提供了前所未有的便利。
單一的大模型在處理所有任務(wù)時(shí)往往存在局限性,因此需要借助外部工具或函數(shù)來(lái)增強(qiáng)其處理能力。
2023 年 6 月 13 日 OpenAI 發(fā)布的 GPT 模型的 Function Calling 功能,成為大模型與現(xiàn)實(shí)世界交互的橋梁。Function Calling 機(jī)制在很大程度上推動(dòng)了 Agent 技術(shù)的發(fā)展。Agent 技術(shù)以其獨(dú)特的自主性和智能性,正逐漸成為大模型應(yīng)用的重要組成部分,引領(lǐng)著新的發(fā)展趨勢(shì)。
在智能化方面,Agent 的學(xué)習(xí)能力得到了極大的增強(qiáng)。傳統(tǒng)的機(jī)器學(xué)習(xí)技術(shù)為 Agent 提供了初步的學(xué)習(xí)框架,使得 Agent 能夠通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方式學(xué)習(xí)并優(yōu)化自身行為。
然而,隨著神經(jīng)網(wǎng)絡(luò)模型的廣泛應(yīng)用,Agent 的學(xué)習(xí)能力得到了質(zhì)的飛躍。深度學(xué)習(xí)技術(shù)使得 Agent 能夠處理更加復(fù)雜、高維的數(shù)據(jù),從而更精確地感知環(huán)境信息并做出相應(yīng)決策。此外,強(qiáng)化學(xué)習(xí)技術(shù)的不斷發(fā)展也為 Agent 提供了持續(xù)學(xué)習(xí)和自我優(yōu)化的能力,使得 Agent 能夠在與環(huán)境的互動(dòng)中不斷改進(jìn)自身策略,實(shí)現(xiàn)更高級(jí)別的智能化。
早期的 Agent 系統(tǒng)往往依賴于預(yù)設(shè)的規(guī)則和策略進(jìn)行決策和行動(dòng),自主性和靈活性相對(duì)有限。然而,隨著大模型推理能力的發(fā)展,Agent 已經(jīng)具備了更高的自主性。這種自主性不僅體現(xiàn)在 Agent 能夠根據(jù)環(huán)境變化和任務(wù)需求自主調(diào)整行為策略上,更表現(xiàn)在 Agent 能夠在一定程度上進(jìn)行自我管理和自我修復(fù),以應(yīng)對(duì)各種復(fù)雜和不確定的情況。
AI Agent 的發(fā)展趨勢(shì)是其逐漸成為 AI 應(yīng)用的核心架構(gòu),通過(guò)自主感知、決策和執(zhí)行能力,實(shí)現(xiàn)對(duì)現(xiàn)有軟件的智能化改造和升級(jí),從而改變業(yè)務(wù)流程和用戶交互方式。
2024 年,開(kāi)源社區(qū)中出現(xiàn)了一些著名的多智能體框架,如 MetaGPT、LangGraph 和 AutoGen,這些框架通過(guò)不同的技術(shù)手段來(lái)解決多智能體系統(tǒng)中的信息冗余和任務(wù)復(fù)雜性問(wèn)題。
這些框架的出現(xiàn)表明,未來(lái)多智能體系統(tǒng)將更加注重靈活性和可定制性。多智能體框架逐漸成為主流,有效解決了單智能體視角局限的問(wèn)題,實(shí)現(xiàn)了多工作流的并行處理,使得推理過(guò)程更加可靠,并具備了對(duì)多模態(tài)數(shù)據(jù)的兼容性。這種趨勢(shì)表明,未來(lái)的 AI Agent 將不再局限于單一任務(wù),而是能夠處理復(fù)雜的多任務(wù)環(huán)境,提高整體效率和可靠性。
AI Agent 的發(fā)展還依賴于大模型的持續(xù)優(yōu)化和創(chuàng)新。大模型的發(fā)展方向包括優(yōu)化性能、利用龐大的訓(xùn)練數(shù)據(jù)集模擬人類行為以及增強(qiáng)模型固有的通用能力。
這些優(yōu)化和創(chuàng)新將推動(dòng) AI Agent 在推理、規(guī)劃、記憶和工具使用等方面的能力提升,2024 年的 OpenAI 的 o1 模型是這方面的典型代表,不僅是 OpenAI 所代表的閉源的大模型是這樣,開(kāi)源的大模型也是在不斷提升智能化能力,例如 2024 年 9 月阿里發(fā)布的 Qwen 2.5 72B 模型成為全球最強(qiáng)開(kāi)源大模型。此外,Qwen 2.5 的整體性能相比前一代提升了超過(guò) 18%,并且在多模態(tài)能力、長(zhǎng)文本處理和指令遵循等方面也有所增強(qiáng)。
大模型應(yīng)用從 Chatbot 到 RAG、Copilot 和 Agent 的發(fā)展歷程充滿了挑戰(zhàn)與機(jī)遇。隨著技術(shù)的不斷進(jìn)步和創(chuàng)新,我們有理由相信,大模型應(yīng)用將在未來(lái)展現(xiàn)出更加廣闊的應(yīng)用前景和巨大的社會(huì)價(jià)值。
-
AI
+關(guān)注
關(guān)注
88文章
35194瀏覽量
280309 -
Agent
+關(guān)注
關(guān)注
0文章
133瀏覽量
27862
原文標(biāo)題:AI Agent逐漸成為AI應(yīng)用的核心架構(gòu)
文章出處:【微信號(hào):OSC開(kāi)源社區(qū),微信公眾號(hào):OSC開(kāi)源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論