電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)3月16日下午,百度在北京總部舉行新聞發(fā)布會(huì),正式發(fā)布新一代大語言模型、生成式 AI 產(chǎn)品文心一言。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏,百度首席技術(shù)官王海峰出席,并展示了文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五個(gè)使用場景中的綜合能力。

文心一言在五大使用場景中的能力展示
在文學(xué)創(chuàng)作方面,李彥宏以《三體》為例,針對“《三體》的作者是哪里人?電視劇《三體》演員都有誰?于和偉和張魯一有哪些共同點(diǎn)?于和偉和張魯一誰更高?”等事實(shí)性問題,文心一言都給出了準(zhǔn)確的回答。
針對“可以總結(jié)一下《三體》的核心內(nèi)容嗎?如果要續(xù)寫的話,可以從哪些角度出發(fā)?如何從哲學(xué)的角度續(xù)寫?”等問題,文心一言也從多個(gè)角度給出了建議,體現(xiàn)出強(qiáng)大的總結(jié)分析能力和推理能力。

在商業(yè)文案創(chuàng)作方面,文心一言順利完成了給公司起名字、寫Slogan、寫新聞稿的任務(wù)。可以看到文心一言可以準(zhǔn)確理解人類意圖,能夠清晰地表達(dá)。這是基于龐大數(shù)據(jù)規(guī)模的訓(xùn)練,文心一言大模型的訓(xùn)練數(shù)據(jù)包括萬億級網(wǎng)頁數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級的語音日均調(diào)用數(shù)據(jù),以及5500億事實(shí)的知識(shí)圖譜等。

在數(shù)理邏輯推算方面,文心一言體現(xiàn)出了很強(qiáng)的推理能力。比如,面對“雞兔同籠”的問題,文心一眼就能夠很快識(shí)別出問題不對。當(dāng)修改問題之后,文心一言能夠很快理解題意,給出解題思路,設(shè)立方程式,一步步得出正確答案。

在中文理解方面,文心一言表現(xiàn)出了對中國文化的強(qiáng)大理解力。比如,正確解釋“洛陽紙貴”的含義,以及“洛陽紙貴”在現(xiàn)代經(jīng)濟(jì)學(xué)原理里對應(yīng)的理論。文心一言還用“洛陽紙貴”創(chuàng)作了一首藏頭詩,“洛陽城里春光好,陽艷無雙不負(fù)賞。紙貴漫天詩詞賦,貴比黃金樂未央?!?br />

在多模態(tài)生成方面,文心一言展示出了文本、圖片、音頻和視頻的生成能力。在音頻生成方面,文心一言可以生成多個(gè)地方的方言,比如廣東話、閩南語,在發(fā)布會(huì)現(xiàn)場演示的是四川話。視頻生成能力方面,因?yàn)槌杀据^高,現(xiàn)階段還未對所有用戶開放,未來會(huì)逐步接入。
李彥宏表示,多模態(tài)是生成式AI一個(gè)明確的發(fā)展趨勢。未來,隨著百度多模態(tài)統(tǒng)一大模型的能力增強(qiáng),文心一言的多模態(tài)生成能力會(huì)不斷提升。

從上述演示來看,文心一言某種程度已經(jīng)具備了對人類意圖的理解能力,能夠較為準(zhǔn)確的、有邏輯的、流暢的表達(dá)。不過李彥宏表示,這類大語言模型還在不斷完善的過程中,它有時(shí)會(huì)帶來驚喜,有時(shí)也會(huì)出錯(cuò),不過它的發(fā)展非常迅速。
大型語言模型帶來的產(chǎn)業(yè)機(jī)會(huì)
無論是哪家公司都不可能靠幾個(gè)月突擊,就做出這樣一個(gè)大型語言模型,深度學(xué)習(xí)、自然語言處理等都需要多年的堅(jiān)持和積累??梢哉f,文心一言是百度過去多年努力的延續(xù)。
人工智能時(shí)代,IT技術(shù)棧發(fā)生了根本性改變,從原來的三層變成了現(xiàn)在的四層,包括芯片層、框架層、模型層、應(yīng)用層。百度是全球范圍內(nèi)為數(shù)不多在四層都有領(lǐng)先產(chǎn)品的公司。

百度AI全棧布局的優(yōu)勢在于,可以在技術(shù)棧的四層架構(gòu)中實(shí)現(xiàn)端到端優(yōu)化,大幅提升效率。相比于之前判別式AI,生成式AI非常消耗算力,費(fèi)用相當(dāng)昂貴,四層之間的協(xié)同作用很關(guān)鍵,尤其是框架層和模型層的協(xié)同,能夠大大提升效率。
百度自2月宣布文心一言以來,已有超過650家企業(yè)宣布加入文心一言生態(tài)。生成式AI代表了一個(gè)新的計(jì)算范式,它會(huì)帶來市場需求的爆發(fā)式增長,將釋放出前所未有的、指數(shù)級的商業(yè)價(jià)值。文心一言不僅影響搜索、互聯(lián)網(wǎng)公司,它可以讓每一家公司都離自己的客戶更近。
大型語言模型會(huì)帶來哪些產(chǎn)業(yè)機(jī)會(huì)?李彥宏談到了三點(diǎn):一是新型云計(jì)算,文心一言將根本性地改變云計(jì)算行業(yè)的游戲規(guī)則,之前企業(yè)選擇云廠商更多看算力、存儲(chǔ)等基礎(chǔ)云服務(wù)。未來,更多會(huì)看框架、模型,以及芯片、框架、模型和應(yīng)用四層之間的協(xié)同。

二是行業(yè)模型精調(diào),這是這是通用大模型和行業(yè)企業(yè)之間的中間層,他們可以基于對行業(yè)的洞察,調(diào)用通用大模型能力,為行業(yè)客戶提供解決方案。這方面,百度文心大模型已經(jīng)在工業(yè)、金融、交通、媒體等領(lǐng)域,發(fā)布了10多個(gè)行業(yè)大模型。
三是應(yīng)用開發(fā),即基于大模型底座進(jìn)行應(yīng)用開發(fā)的公司,對于大部分創(chuàng)業(yè)企業(yè)來說,真正的機(jī)會(huì)并不是從頭開始做ChatGPT和文心一言這樣的基礎(chǔ)大模型,而是基于通用大語言模型搶先開發(fā)重要的應(yīng)用服務(wù)。目前基于文本、圖片、音視頻生成、數(shù)字人、3D生成等場景,已經(jīng)涌現(xiàn)出很多創(chuàng)業(yè)明星公司。
從技術(shù)層面來看,文心一言是新一代知識(shí)增強(qiáng)大語言模型,具備對話交互、內(nèi)容創(chuàng)作、知識(shí)推理、多模態(tài)生成等能力。
據(jù)王海峰介紹,它的關(guān)鍵技術(shù)包括有監(jiān)督精調(diào)、人類反饋的強(qiáng)化學(xué)習(xí)、提示、知識(shí)增強(qiáng)、檢索增強(qiáng)和對話增強(qiáng)。前三項(xiàng)是這類大語言模型都會(huì)采用的技術(shù),ERNIE和PLATO中已經(jīng)有應(yīng)用和積累,在文心一言中又有了進(jìn)一步強(qiáng)化和打磨;后三項(xiàng)則是百度已有技術(shù)優(yōu)勢的再創(chuàng)新,也是文心一言未來越來越強(qiáng)大的基礎(chǔ)。

在知識(shí)增強(qiáng)方面,文心一言主要是通過知識(shí)內(nèi)化和知識(shí)外用兩種方式。知識(shí)內(nèi)化,是從大規(guī)模知識(shí)和無標(biāo)注數(shù)據(jù)中,基于語義單元學(xué)習(xí),利用知識(shí)構(gòu)造訓(xùn)練數(shù)據(jù),將知識(shí)學(xué)習(xí)到模型參數(shù)中;知識(shí)外用,是引入外部多源異構(gòu)知識(shí),做知識(shí)推理、提示構(gòu)建等。
在檢索增強(qiáng)方面,文心一言是來自以語義理解與語義匹配為核心技術(shù)的新一代搜索架構(gòu)。通過引入搜索結(jié)果,可以為大模型提供時(shí)效性強(qiáng)、準(zhǔn)確率高的參考信息,更好地滿足用戶需求。
在對話增強(qiáng)方面,基于對話技術(shù)和應(yīng)用積累,文心一言具備記憶機(jī)制、上下文理解和對話規(guī)劃能力,實(shí)現(xiàn)更好的對話連貫性、合理性和邏輯性。
飛槳深度學(xué)習(xí)平臺(tái)支撐文心一言效果更好、效率更高、性能更強(qiáng)。王海峰強(qiáng)調(diào),對于開發(fā)訓(xùn)練,飛槳?jiǎng)屿o統(tǒng)一的開發(fā)范式,以及自適應(yīng)分布式架構(gòu),可以實(shí)現(xiàn)大模型的靈活開發(fā)和高效訓(xùn)練。在推理部署方面,飛槳提供高并發(fā)彈性服務(wù)化部署,深度計(jì)算融合優(yōu)化,軟硬協(xié)同稀疏量化加速、模型自適應(yīng)蒸餾剪裁等,支持大模型高效推理。

小結(jié)
文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五大使用場景中展示出了比較強(qiáng)的理解能力和推理能力。
不過整體而言,文心一言目前來說還并不完善,未來隨著用戶的接入使用,及百度在技術(shù)上的不斷調(diào)優(yōu),文心一言將會(huì)不斷迭代,并展現(xiàn)出更強(qiáng)大的能力。在李彥宏看來,人工智能會(huì)徹底改變今天的每一個(gè)行業(yè),文心一言是創(chuàng)新驅(qū)動(dòng)發(fā)展的最佳證明。

文心一言在五大使用場景中的能力展示
在文學(xué)創(chuàng)作方面,李彥宏以《三體》為例,針對“《三體》的作者是哪里人?電視劇《三體》演員都有誰?于和偉和張魯一有哪些共同點(diǎn)?于和偉和張魯一誰更高?”等事實(shí)性問題,文心一言都給出了準(zhǔn)確的回答。
針對“可以總結(jié)一下《三體》的核心內(nèi)容嗎?如果要續(xù)寫的話,可以從哪些角度出發(fā)?如何從哲學(xué)的角度續(xù)寫?”等問題,文心一言也從多個(gè)角度給出了建議,體現(xiàn)出強(qiáng)大的總結(jié)分析能力和推理能力。

在商業(yè)文案創(chuàng)作方面,文心一言順利完成了給公司起名字、寫Slogan、寫新聞稿的任務(wù)。可以看到文心一言可以準(zhǔn)確理解人類意圖,能夠清晰地表達(dá)。這是基于龐大數(shù)據(jù)規(guī)模的訓(xùn)練,文心一言大模型的訓(xùn)練數(shù)據(jù)包括萬億級網(wǎng)頁數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級的語音日均調(diào)用數(shù)據(jù),以及5500億事實(shí)的知識(shí)圖譜等。

在數(shù)理邏輯推算方面,文心一言體現(xiàn)出了很強(qiáng)的推理能力。比如,面對“雞兔同籠”的問題,文心一眼就能夠很快識(shí)別出問題不對。當(dāng)修改問題之后,文心一言能夠很快理解題意,給出解題思路,設(shè)立方程式,一步步得出正確答案。

在中文理解方面,文心一言表現(xiàn)出了對中國文化的強(qiáng)大理解力。比如,正確解釋“洛陽紙貴”的含義,以及“洛陽紙貴”在現(xiàn)代經(jīng)濟(jì)學(xué)原理里對應(yīng)的理論。文心一言還用“洛陽紙貴”創(chuàng)作了一首藏頭詩,“洛陽城里春光好,陽艷無雙不負(fù)賞。紙貴漫天詩詞賦,貴比黃金樂未央?!?br />

在多模態(tài)生成方面,文心一言展示出了文本、圖片、音頻和視頻的生成能力。在音頻生成方面,文心一言可以生成多個(gè)地方的方言,比如廣東話、閩南語,在發(fā)布會(huì)現(xiàn)場演示的是四川話。視頻生成能力方面,因?yàn)槌杀据^高,現(xiàn)階段還未對所有用戶開放,未來會(huì)逐步接入。
李彥宏表示,多模態(tài)是生成式AI一個(gè)明確的發(fā)展趨勢。未來,隨著百度多模態(tài)統(tǒng)一大模型的能力增強(qiáng),文心一言的多模態(tài)生成能力會(huì)不斷提升。

從上述演示來看,文心一言某種程度已經(jīng)具備了對人類意圖的理解能力,能夠較為準(zhǔn)確的、有邏輯的、流暢的表達(dá)。不過李彥宏表示,這類大語言模型還在不斷完善的過程中,它有時(shí)會(huì)帶來驚喜,有時(shí)也會(huì)出錯(cuò),不過它的發(fā)展非常迅速。
大型語言模型帶來的產(chǎn)業(yè)機(jī)會(huì)
無論是哪家公司都不可能靠幾個(gè)月突擊,就做出這樣一個(gè)大型語言模型,深度學(xué)習(xí)、自然語言處理等都需要多年的堅(jiān)持和積累??梢哉f,文心一言是百度過去多年努力的延續(xù)。
人工智能時(shí)代,IT技術(shù)棧發(fā)生了根本性改變,從原來的三層變成了現(xiàn)在的四層,包括芯片層、框架層、模型層、應(yīng)用層。百度是全球范圍內(nèi)為數(shù)不多在四層都有領(lǐng)先產(chǎn)品的公司。

百度AI全棧布局的優(yōu)勢在于,可以在技術(shù)棧的四層架構(gòu)中實(shí)現(xiàn)端到端優(yōu)化,大幅提升效率。相比于之前判別式AI,生成式AI非常消耗算力,費(fèi)用相當(dāng)昂貴,四層之間的協(xié)同作用很關(guān)鍵,尤其是框架層和模型層的協(xié)同,能夠大大提升效率。
百度自2月宣布文心一言以來,已有超過650家企業(yè)宣布加入文心一言生態(tài)。生成式AI代表了一個(gè)新的計(jì)算范式,它會(huì)帶來市場需求的爆發(fā)式增長,將釋放出前所未有的、指數(shù)級的商業(yè)價(jià)值。文心一言不僅影響搜索、互聯(lián)網(wǎng)公司,它可以讓每一家公司都離自己的客戶更近。
大型語言模型會(huì)帶來哪些產(chǎn)業(yè)機(jī)會(huì)?李彥宏談到了三點(diǎn):一是新型云計(jì)算,文心一言將根本性地改變云計(jì)算行業(yè)的游戲規(guī)則,之前企業(yè)選擇云廠商更多看算力、存儲(chǔ)等基礎(chǔ)云服務(wù)。未來,更多會(huì)看框架、模型,以及芯片、框架、模型和應(yīng)用四層之間的協(xié)同。

二是行業(yè)模型精調(diào),這是這是通用大模型和行業(yè)企業(yè)之間的中間層,他們可以基于對行業(yè)的洞察,調(diào)用通用大模型能力,為行業(yè)客戶提供解決方案。這方面,百度文心大模型已經(jīng)在工業(yè)、金融、交通、媒體等領(lǐng)域,發(fā)布了10多個(gè)行業(yè)大模型。
三是應(yīng)用開發(fā),即基于大模型底座進(jìn)行應(yīng)用開發(fā)的公司,對于大部分創(chuàng)業(yè)企業(yè)來說,真正的機(jī)會(huì)并不是從頭開始做ChatGPT和文心一言這樣的基礎(chǔ)大模型,而是基于通用大語言模型搶先開發(fā)重要的應(yīng)用服務(wù)。目前基于文本、圖片、音視頻生成、數(shù)字人、3D生成等場景,已經(jīng)涌現(xiàn)出很多創(chuàng)業(yè)明星公司。
從技術(shù)層面來看,文心一言是新一代知識(shí)增強(qiáng)大語言模型,具備對話交互、內(nèi)容創(chuàng)作、知識(shí)推理、多模態(tài)生成等能力。
據(jù)王海峰介紹,它的關(guān)鍵技術(shù)包括有監(jiān)督精調(diào)、人類反饋的強(qiáng)化學(xué)習(xí)、提示、知識(shí)增強(qiáng)、檢索增強(qiáng)和對話增強(qiáng)。前三項(xiàng)是這類大語言模型都會(huì)采用的技術(shù),ERNIE和PLATO中已經(jīng)有應(yīng)用和積累,在文心一言中又有了進(jìn)一步強(qiáng)化和打磨;后三項(xiàng)則是百度已有技術(shù)優(yōu)勢的再創(chuàng)新,也是文心一言未來越來越強(qiáng)大的基礎(chǔ)。

在知識(shí)增強(qiáng)方面,文心一言主要是通過知識(shí)內(nèi)化和知識(shí)外用兩種方式。知識(shí)內(nèi)化,是從大規(guī)模知識(shí)和無標(biāo)注數(shù)據(jù)中,基于語義單元學(xué)習(xí),利用知識(shí)構(gòu)造訓(xùn)練數(shù)據(jù),將知識(shí)學(xué)習(xí)到模型參數(shù)中;知識(shí)外用,是引入外部多源異構(gòu)知識(shí),做知識(shí)推理、提示構(gòu)建等。
在檢索增強(qiáng)方面,文心一言是來自以語義理解與語義匹配為核心技術(shù)的新一代搜索架構(gòu)。通過引入搜索結(jié)果,可以為大模型提供時(shí)效性強(qiáng)、準(zhǔn)確率高的參考信息,更好地滿足用戶需求。
在對話增強(qiáng)方面,基于對話技術(shù)和應(yīng)用積累,文心一言具備記憶機(jī)制、上下文理解和對話規(guī)劃能力,實(shí)現(xiàn)更好的對話連貫性、合理性和邏輯性。
飛槳深度學(xué)習(xí)平臺(tái)支撐文心一言效果更好、效率更高、性能更強(qiáng)。王海峰強(qiáng)調(diào),對于開發(fā)訓(xùn)練,飛槳?jiǎng)屿o統(tǒng)一的開發(fā)范式,以及自適應(yīng)分布式架構(gòu),可以實(shí)現(xiàn)大模型的靈活開發(fā)和高效訓(xùn)練。在推理部署方面,飛槳提供高并發(fā)彈性服務(wù)化部署,深度計(jì)算融合優(yōu)化,軟硬協(xié)同稀疏量化加速、模型自適應(yīng)蒸餾剪裁等,支持大模型高效推理。

小結(jié)
文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五大使用場景中展示出了比較強(qiáng)的理解能力和推理能力。
不過整體而言,文心一言目前來說還并不完善,未來隨著用戶的接入使用,及百度在技術(shù)上的不斷調(diào)優(yōu),文心一言將會(huì)不斷迭代,并展現(xiàn)出更強(qiáng)大的能力。在李彥宏看來,人工智能會(huì)徹底改變今天的每一個(gè)行業(yè),文心一言是創(chuàng)新驅(qū)動(dòng)發(fā)展的最佳證明。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報(bào)投訴
-
文心一言
+關(guān)注
關(guān)注
0文章
133瀏覽量
1853 -
大模型
+關(guān)注
關(guān)注
2文章
3135瀏覽量
4057
發(fā)布評論請先 登錄
相關(guān)推薦
熱點(diǎn)推薦
百度文心大模型X1 Turbo獲得信通院當(dāng)前大模型最高評級證書
百度在520居然還領(lǐng)了個(gè)證?是它, 信通院當(dāng)前大模型最高評級證書 ! 在5月20日的百度AI Day 上,中國信通院公布了大模型推理能力評估結(jié)果——

百度發(fā)布文心4.5 Turbo、X1 Turbo和多款A(yù)I應(yīng)用
近日,Create2025百度AI開發(fā)者大會(huì)在武漢舉辦。百度創(chuàng)始人李彥宏發(fā)布了
百度發(fā)布文心大模型4.5和文心大模型X1
文心大模型4.5是百度自主研發(fā)的新一代原生多模態(tài)基礎(chǔ)大模型,通過多個(gè)模態(tài)聯(lián)合建模實(shí)現(xiàn)協(xié)同優(yōu)化,多
deepseek和文心一言兩者有什么區(qū)別?哪個(gè)跟合適您使用呢?
(DeepSeek)公司開發(fā),該公司專注于開發(fā)低成本、高性能的AI模型,致力于通過技術(shù)創(chuàng)新推動(dòng)人工智能技術(shù)的普惠化。DeepSeek可能基于獨(dú)特的技術(shù)架構(gòu)和算法,如混合專家(MoE)架構(gòu)和多頭潛在注意力(MLA)機(jī)制。 ◆ 文心
李彥宏:DeepSeek啟示我們應(yīng)將頂尖模型開源
,百度董事長兼 CEO 李彥宏,移動(dòng)生態(tài)事業(yè)群總裁羅戎,智能云事業(yè)群總裁沈抖,代理 CFO 何俊杰等高管出席隨后召開的財(cái)報(bào)電話會(huì)議,解讀財(cái)報(bào)要點(diǎn)并回答分析師提問。 摘錄部分內(nèi)容如下:

李彥宏:百度蘿卜快跑2025年將大幅擴(kuò)張
在百度近期舉行的業(yè)績會(huì)上,公司創(chuàng)始人李彥宏透露了一個(gè)令業(yè)界矚目的消息:2025年將是百度蘿卜快跑
百度下一代文心大模型正式開源
隨著文心大模型的迭代升級和成本不斷下降,文心一言將于4月1日0時(shí)起全面免費(fèi),所有PC端和APP端
百度文心大模型將升級并開源
百度近日宣布,其文心大模型系列將迎來新版本升級,計(jì)劃在未來數(shù)月內(nèi)逐步推出文心大模型4.5系列。這一
百度文心大模型4月1日起全面免費(fèi)開放
列最新的模型功能。 百度表示,文心大模型的此次升級不僅帶來了更加豐富的功能,還致力于提升用戶體驗(yàn)
百度宣布文心一言將全面免費(fèi)
隨著文心大模型的迭代升級和成本不斷下降,文心一言將于4月1日零時(shí)起,全面免費(fèi),所有PC端和APP
李彥宏:大模型行業(yè)消除幻覺,iRAG技術(shù)引領(lǐng)文生圖新紀(jì)元
在理解和生成內(nèi)容方面邁出了重要一步,使得AI的輸出更加貼近真實(shí)世界,減少了誤導(dǎo)和誤解。 同時(shí),李彥宏還發(fā)布了
百度文心大模型日均調(diào)用量超15億
近日,百度在上海世博中心舉辦了主題為“應(yīng)用來了”的百度世界2024大會(huì)。會(huì)上,百度董事長李彥宏分
李彥宏宣布:百度文心大模型日調(diào)用量超15億
在百度世界2024大會(huì)上,百度公司創(chuàng)始人李彥宏宣布了一項(xiàng)令人矚目的數(shù)據(jù):
評論