百度在520居然還領(lǐng)了個證?是它,信通院當(dāng)前大模型最高評級證書!
在5月20日的百度AI Day 上,中國信通院公布了大模型推理能力評估結(jié)果——
百度文心大模型X1 Turbo在24項能力評估中,16項達(dá)5分,綜合評級獲當(dāng)前最高級“4+級”,成為國內(nèi)首款通過該測評的大模型。文心X1 Turbo邏輯推理、代碼推理、推理效果優(yōu)化等技術(shù)能力及工具支持度、安全可靠度等應(yīng)用能力均獲得滿分。
AI Day現(xiàn)場,百度吳甜系統(tǒng)性講解了文心大模型最新版的技術(shù)創(chuàng)新。她介紹,文心大模型4.5是多模態(tài)基礎(chǔ)大模型,文心4.5 Turbo源自文心4.5,效果更好、成本更低;基于文心4.5 Turbo,文心X1升級到X1 Turbo,性能提升的同時,具備更先進(jìn)的思維鏈,問答、創(chuàng)作、邏輯推理、工具調(diào)用和多模態(tài)能力進(jìn)一步增強(qiáng)。
中國信息通信研究院人工智能研究所平臺與工程化部主任曹峰表示:
評估結(jié)果表明,文心X1 Turbo擅長結(jié)構(gòu)化的邏輯思考,并具備平衡模型能力與效率的優(yōu)化技術(shù),其有效的數(shù)據(jù)機(jī)制保障了模型的可信及可用程度,其推理服務(wù)能廣泛支持各類應(yīng)用。文心X1 Turbo強(qiáng)化推理泛化能力,拓寬工具鏈應(yīng)用生態(tài),加強(qiáng)安全機(jī)制建設(shè),構(gòu)筑可信應(yīng)用保障壁壘。
舉兩個例子——
當(dāng)你把一張外文的藥品說明書拍照上傳到文心大模型4.5 Turbo,它可以:
◎ 看懂圖片:不僅能識別圖片中的文字,還能根據(jù)圖片內(nèi)容判斷這是“用于緩解肌肉或關(guān)節(jié)疼痛的藥品”;
◎ 多語種翻譯:把識別出的日文翻譯成中文,并根據(jù)圖示中的紅色字標(biāo)記重點(diǎn),比如注意事項等。
這樣一來,即使你完全不懂日語,也能快速搞明白這藥是干什么的、怎么用才安全。
你還可以拍照上傳作業(yè)題目,讓文心X1 Turbo解答:
◎它會先思考解答這個題目的思路;
◎ 自主規(guī)劃,識別圖片中的明面信息和隱藏含義;
◎ 再思考分析,反思每個答案的準(zhǔn)確性;
◎ 最后,給出詳細(xì)步驟和答案。
思維與行動融合的指導(dǎo)模式,絕對比家長輔導(dǎo)有耐心!
//多模態(tài)大模型:提升學(xué)習(xí)效率和效果
文心4.5和4.5 Turbo實(shí)現(xiàn)了文本、圖像和視頻的混合訓(xùn)練。
針對不同模態(tài)數(shù)據(jù)在結(jié)構(gòu)、規(guī)模、知識密度上的差異,通過多模態(tài)異構(gòu)專家建模、自適應(yīng)分辨率視覺編碼、時空重排列的三維旋轉(zhuǎn)位置編碼、自適應(yīng)模態(tài)感知損失計算等技術(shù),大幅提升跨模態(tài)學(xué)習(xí)效率和多模態(tài)融合效果,學(xué)習(xí)效率提高近2倍,多模態(tài)理解效果提升超過30%。
//自反饋增強(qiáng)框架:讓模型學(xué)會“自我迭代”
后訓(xùn)練方面,百度研制了自反饋增強(qiáng)的技術(shù)框架,基于大模型自身的生成和評估反饋能力,實(shí)現(xiàn)了“訓(xùn)練-生成-反饋-增強(qiáng)”的模型迭代閉環(huán),不僅解決了大模型對齊過程中,數(shù)據(jù)生產(chǎn)難度大、成本高、速度慢等問題,而且顯著降低了模型幻覺,模型理解和處理復(fù)雜任務(wù)的能力大幅提升。
在訓(xùn)練階段,通過融合偏好學(xué)習(xí)的強(qiáng)化學(xué)習(xí)技術(shù),實(shí)現(xiàn)多元統(tǒng)一獎勵機(jī)制,提升了對結(jié)果質(zhì)量判別的準(zhǔn)確率,通過離線偏好學(xué)習(xí)和在線強(qiáng)化學(xué)習(xí)統(tǒng)一優(yōu)化,進(jìn)一步提升了數(shù)據(jù)利用效率和訓(xùn)練穩(wěn)定性,并增強(qiáng)了模型對高質(zhì)量結(jié)果的感知。此外,因?yàn)橥ㄟ^偏好信號與獎勵信號的融合運(yùn)用,模型的理解、生成、邏輯和記憶等能力全面提升。
//深度思考:從“單線思維”到“復(fù)合思維”
深度思考方面,突破了僅基于思維鏈優(yōu)化的范式,在思考路徑中結(jié)合工具調(diào)用,構(gòu)建了融合思考和行動的復(fù)合思維鏈,模型解決問題能力得到顯著提升。同時,結(jié)合多元統(tǒng)一的獎勵機(jī)制,實(shí)現(xiàn)了思考和行動鏈的端到端優(yōu)化,大幅提升了跨領(lǐng)域的問題解決能力。
//數(shù)據(jù)建設(shè)閉環(huán):實(shí)現(xiàn)快速、高效的數(shù)據(jù)生產(chǎn)
數(shù)據(jù)方面,打造了“數(shù)據(jù)挖掘與合成 - 數(shù)據(jù)分析與評估 - 模型能力反饋”的數(shù)據(jù)建設(shè)閉環(huán),為模型訓(xùn)練源源不斷地生產(chǎn)知識密度高、類型多樣、領(lǐng)域覆蓋廣的大規(guī)模數(shù)據(jù)。同時,數(shù)據(jù)建設(shè)流程具備良好的可擴(kuò)展性,能夠輕松遷移到全新的數(shù)據(jù)類型,實(shí)現(xiàn)快速、高效的數(shù)據(jù)生產(chǎn)。
從多項基準(zhǔn)測試結(jié)果來看,文心大模型4.5 Turbo、X1 Turbo表現(xiàn)出色,效果領(lǐng)先。
//更前瞻、更具想象力的創(chuàng)新應(yīng)用
大模型的能力進(jìn)一步拓展、效率進(jìn)一步提升之后,可以探索更前瞻、更有想象力的創(chuàng)新應(yīng)用。
以數(shù)字人為例,超擬真數(shù)字人需要具備出色的表現(xiàn)力、吸引人的內(nèi)容、數(shù)字人與場景、物品的互動等,需要綜合運(yùn)用多模態(tài)AI技術(shù)。百度研制了“劇本”驅(qū)動多模協(xié)同的超擬真數(shù)字人技術(shù),實(shí)現(xiàn)了語言、聲音、形象的協(xié)調(diào)一致。目前這套技術(shù)已經(jīng)支持超過10萬數(shù)字人主播,直播轉(zhuǎn)化率達(dá)31%,降低80%直播開播成本。
而在代碼場景上,基于文心大模型的語言和代碼能力,百度研制了代碼智能體和智能代碼助手——文心快碼。百度每天新增的代碼中,文心快碼生成的代碼占比已超過40%。截至目前,文心快碼向全社會開放,累計服務(wù)760萬開發(fā)者。
文心大模型的能力拓展和效率提升,得益于飛槳文心的聯(lián)合優(yōu)化。公開數(shù)據(jù)顯示,飛槳文心開發(fā)者數(shù)量已超過2185萬,服務(wù)超過67萬家企業(yè),創(chuàng)建的模型達(dá)到110萬。此外,基于飛槳文心,百度在全國范圍內(nèi)落地了7個產(chǎn)業(yè)賦能中心和7個教育創(chuàng)新中心,以及兩個數(shù)據(jù)生態(tài)中心,形成了繁榮的良性發(fā)展生態(tài)。
//16歲高中生:打開文心一言,就像打開新華字典一樣
本次AI Day ,我們還邀請到了一位16歲的高中生——陳君航。這位來自福建惠安第三中學(xué)的高一學(xué)生,從2023年就開始接觸文心一言,自那以后,文心一言幾乎陪伴了他整個中考備考過程。
初次接觸文心一言時,陳君航正為語文作文的修改發(fā)愁,于是就把作文和老師點(diǎn)評發(fā)給文心一言,讓它逐句分析給出修改建議。他說,“我打開文心一言,就像打開新華字典一樣頻繁。在它的陪伴下,我的寫作能力得到很大提升?!?/p>
陳君航還借助文心一言從零自學(xué)了Python,開發(fā)出“智能文案生成器”幫媽媽減輕繁重的教學(xué)任務(wù),原本三天的工作,現(xiàn)在只需幾小時就可以完成。
當(dāng)大模型學(xué)會像人類一樣感知世界,像人類一樣思考和行動并自我進(jìn)化,技術(shù)進(jìn)步便真正轉(zhuǎn)化為普惠的社會紅利。正如陳君航所說:“技術(shù)真正的魅力不是驚艷誰,而是真正解決一個又一個真實(shí)的問題”。
“領(lǐng)證”并不是終點(diǎn),大模型能力的進(jìn)一步拓展,對創(chuàng)新應(yīng)用的探索仍在繼續(xù)!
-
百度
+關(guān)注
關(guān)注
9文章
2331瀏覽量
92016 -
文心一言
+關(guān)注
關(guān)注
0文章
130瀏覽量
1783 -
大模型
+關(guān)注
關(guān)注
2文章
3085瀏覽量
3963
原文標(biāo)題:今天520,我們領(lǐng)了個證
文章出處:【微信號:baidu_2000,微信公眾號:百度】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
評論