如果將人工智能(AI)比喻為一個(gè)正在成長(zhǎng)的孩子,那么規(guī)模法則(Scaling Law)就是其成長(zhǎng)過程中的核心驅(qū)動(dòng)力。只要給予這個(gè)“孩子”充足的數(shù)據(jù)、模型和算力這些“營(yíng)養(yǎng)”,它便能茁壯成長(zhǎng)。2020年,OpenAI發(fā)表的《神經(jīng)語言模型的規(guī)模法則》論文,為大語言模型的發(fā)展奠定了理論基礎(chǔ),也讓規(guī)模法則成為了AI領(lǐng)域的基石。
然而,胡英東博士指出,當(dāng)前的AI模型還遠(yuǎn)未達(dá)到真正的通用性,無法應(yīng)對(duì)用戶提出的各種復(fù)雜指令。在2024年11月4日的上海第七屆中國(guó)國(guó)際進(jìn)口博覽會(huì)上,機(jī)器人與媒體記者的互動(dòng)雖然引人注目,但距離真正的通用智能還有一段距離。
如今,規(guī)模法則正在為機(jī)器人領(lǐng)域打開一扇全新的大門。清華大學(xué)交叉信息研究院(IIIS)的研究團(tuán)隊(duì)在預(yù)印本網(wǎng)站arXiv上發(fā)表的論文《機(jī)器人操作模仿學(xué)習(xí)中的數(shù)據(jù)規(guī)模法則》顯示,在規(guī)模法則的指導(dǎo)下,機(jī)器人實(shí)現(xiàn)了真正的零樣本泛化,無需任何微調(diào)就能適應(yīng)全新的場(chǎng)景和物體,成功率高達(dá)90%。泛化能力是指模型或算法在處理新數(shù)據(jù)時(shí)的表現(xiàn),這一突破意味著機(jī)器人正在向理解和適應(yīng)物理世界邁出重要一步。
胡英東博士是嵌入式AI領(lǐng)域的專家,他研究了開發(fā)通用機(jī)器人系統(tǒng)所面臨的挑戰(zhàn),特別是這些系統(tǒng)如何適應(yīng)不同的、非結(jié)構(gòu)化的現(xiàn)實(shí)世界環(huán)境。在IIIS團(tuán)隊(duì)的研究中,便攜式手持夾爪UMI在8種從未見過的環(huán)境中展現(xiàn)出了驚人的適應(yīng)能力。
ChatGPT的問世驗(yàn)證了規(guī)模法則的“智能涌現(xiàn)”能力,即規(guī)模越大,效果越優(yōu)。然而,在機(jī)器人領(lǐng)域,全面的規(guī)模法則尚未建立,因此其發(fā)展速度并未像深度學(xué)習(xí)領(lǐng)域那樣迅速。為了探究數(shù)據(jù)規(guī)模法則,IIIS團(tuán)隊(duì)設(shè)計(jì)了物體泛化、環(huán)境泛化及環(huán)境-物體組合泛化三大維度,通過調(diào)整訓(xùn)練數(shù)據(jù)規(guī)模,評(píng)估數(shù)據(jù)規(guī)模對(duì)機(jī)器人策略泛化性能的影響。
研究發(fā)現(xiàn),策略的泛化性能與環(huán)境和訓(xùn)練時(shí)接觸的物體數(shù)量之間存在顯著的冪律關(guān)系。當(dāng)環(huán)境多樣性足夠豐富時(shí),單一環(huán)境中過度采集不同操作物體的數(shù)據(jù)所帶來的效用將變得微乎其微。此外,單個(gè)物體的演示數(shù)據(jù)很容易達(dá)到飽和,總演示數(shù)據(jù)達(dá)到800次時(shí),性能就開始趨于穩(wěn)定。
盡管IIIS團(tuán)隊(duì)的研究取得了顯著成果,但胡英東博士表示,目前的研究還僅限于單任務(wù)策略的數(shù)據(jù)規(guī)模,并未探索多任務(wù)的通用性。此外,要實(shí)現(xiàn)商業(yè)化應(yīng)用,還需要達(dá)到更高的成功率。他相信,未來會(huì)有通用機(jī)器人的出現(xiàn),但目前仍有許多重要的研究問題需要解決。
在學(xué)界努力的同時(shí),企業(yè)界也在積極將通用人工智能引入物理世界。OpenAI等巨頭正在開發(fā)大規(guī)模AI模型和算法,為機(jī)器人提供動(dòng)力。雖然有人將IIIS團(tuán)隊(duì)的最新研究稱為“人形機(jī)器人的ChatGPT時(shí)刻”,但胡英東博士認(rèn)為,這個(gè)時(shí)刻還未真正到來,需要更多的技術(shù)突破。
然而,他相信這項(xiàng)技術(shù)最終會(huì)進(jìn)入日常實(shí)際應(yīng)用,如餐館的服務(wù)機(jī)器人、養(yǎng)老院的護(hù)理機(jī)器人等。這些應(yīng)用將極大地改變?nèi)藗兊纳罘绞?,提高生活質(zhì)量。
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
29723瀏覽量
212789 -
AI
+關(guān)注
關(guān)注
88文章
35091瀏覽量
279451 -
人工智能
+關(guān)注
關(guān)注
1806文章
49006瀏覽量
249274
發(fā)布評(píng)論請(qǐng)先 登錄
明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量
盤點(diǎn)#機(jī)器人開發(fā)平臺(tái)
【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】機(jī)器人入門的引路書
黑芝麻智能引領(lǐng)人形機(jī)器人技術(shù)邁向新高度
AgiBot World Colosseo:構(gòu)建通用機(jī)器人智能的規(guī)模化數(shù)據(jù)平臺(tái)

名單公布!【書籍評(píng)測(cè)活動(dòng)NO.58】ROS 2智能機(jī)器人開發(fā)實(shí)踐
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人的基礎(chǔ)模塊
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能
《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型
《具身智能機(jī)器人系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器人系統(tǒng)背景知識(shí)與基礎(chǔ)模塊
移動(dòng)機(jī)器人的技術(shù)突破和未來展望

評(píng)論