一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Net5.5G智能云網(wǎng)即將全面發(fā)布,打造新一代數(shù)字基礎(chǔ)設(shè)施

華為數(shù)據(jù)通信 ? 來源:智能感知與物聯(lián)網(wǎng)技術(shù)研 ? 2024-02-26 10:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

中科大團(tuán)隊(duì)開發(fā)首個(gè)通用的大語言模型分子交互學(xué)習(xí)框架,在多個(gè)數(shù)據(jù)集超 4,000,000 個(gè)分子對(duì)上驗(yàn)證了其可靠性。

簡(jiǎn)述

分子關(guān)系學(xué)習(xí)(Molecular Relational Learning)旨在理解和建模分子對(duì)的交互作用,如分子對(duì)交互(Drug-drug Interaction,DDI)、溶液-溶劑交互(Solution-solvent Interaction)。近來,憑借豐富的知識(shí)儲(chǔ)備和優(yōu)秀的推演能力,大型語言模型(LLMs)已成為實(shí)現(xiàn)分子關(guān)系高效學(xué)習(xí)的重要工具。

盡管這一方法頗有成效,但當(dāng)前范式的主要問題是數(shù)據(jù)利用的不充分。如下圖(a)所示,當(dāng)前范式主要依賴于文本數(shù)據(jù)(如 SMILES),未能充分且顯式地利用分子圖中固有的豐富結(jié)構(gòu)信息。

加劇這一問題的是統(tǒng)一學(xué)習(xí)框架的缺失,因?yàn)槠渥璧K了從各個(gè)數(shù)據(jù)集中學(xué)習(xí)到的關(guān)鍵交互信息與底層交互邏輯的高效共享和整合。如下圖 b 所示,這一缺失擴(kuò)大了數(shù)據(jù)利用的不充分的影響,使得 LLMs 因高度過擬合的風(fēng)險(xiǎn)而無法建模那些廣泛存在的、數(shù)據(jù)量較少的分子交互任務(wù)。

wKgZomXb-xiAG2xwAAQuCmS3G-g797.jpg

▲ 圖1:當(dāng)前基于 LLMs 的分子交互學(xué)習(xí)范式與 MolTC 的比較。(a)現(xiàn)行方法的通用范式;(b)將當(dāng)前范式應(yīng)用于樣本量較少的任務(wù)時(shí)所帶來的挑戰(zhàn);(c)我們的 MolTC 的架構(gòu)。

為了緩解這一問題,我們提出了一個(gè)通用的、基于 LLM 的多模態(tài)分子交互學(xué)習(xí)框架,MolTC(Molecular inTeraction Modeling enhanced by Chain-of-thought theory)。如上圖 c 所示,MolTC 通過圖編碼器(Encoder)和映射器(Projector)高效地建模分子圖信息,并創(chuàng)新性地提出了多層級(jí)思維鏈(Multi-hierarchical Chain-of-thought)的概念來引導(dǎo)訓(xùn)練范式的優(yōu)化。

此外,為了加強(qiáng)數(shù)據(jù)間的信息共享,我們?yōu)槠湓O(shè)計(jì)了一個(gè)新穎的動(dòng)態(tài)參數(shù)共享策略,以實(shí)現(xiàn)效率和精度的雙贏。同時(shí),鑒于這一領(lǐng)域數(shù)據(jù)集的缺失,我們還構(gòu)建了一個(gè)全面的分子交互指令數(shù)據(jù)集,MoT-instructions,用于提高當(dāng)前基于 LLMs 的學(xué)習(xí)框架(包擴(kuò)我們的 MolTC)對(duì)分子交互任務(wù)的理解能力。

我們?cè)谏婕俺^ 4,000,000 個(gè)分子對(duì)的十二個(gè)不同領(lǐng)域數(shù)據(jù)集上進(jìn)行了驗(yàn)證實(shí)驗(yàn)。結(jié)果表明,我們的方法優(yōu)于當(dāng)前基于 GNN 的、基于(除 GNN 外)其它傳統(tǒng)深度學(xué)習(xí)架構(gòu)的、和基于 LLMs 的基線方法。

多模態(tài)輸入框架

我們首先簡(jiǎn)要介紹上圖 c 中所示的 MolTC 框架。其中,Graph Encoder 采用傳統(tǒng)的圖神經(jīng)網(wǎng)絡(luò)(GNN)架構(gòu);Projector 采用在視覺領(lǐng)域常用于多模態(tài)對(duì)齊的 Querying Transformers (Q-Former)架構(gòu),作為 backbone 的 LLM 則是采用在生化任務(wù)中表現(xiàn)突出的 Galactica。更多細(xì)節(jié)勞請(qǐng)移步我們的論文和代碼。

基于多層級(jí)思維鏈的訓(xùn)練范式

我們重點(diǎn)介紹基于多層級(jí)思維鏈的 MolTC 訓(xùn)練范式。首先,考慮到從分子對(duì)中直接生成復(fù)雜相互作用的挑戰(zhàn)性,處于上層的思維鏈指導(dǎo) MolTC 的預(yù)訓(xùn)練過程優(yōu)先識(shí)別并按次序輸出輸入分子對(duì)中,每個(gè)分子的關(guān)鍵生化性質(zhì),為準(zhǔn)確預(yù)測(cè)它們的交互奠定基礎(chǔ)。具體而言,在預(yù)訓(xùn)練階段,Prompts 的統(tǒng)一設(shè)計(jì)如下:

wKgZomXb-xeACnZ9AADkUPAur2E880.jpg

預(yù)訓(xùn)練階段的數(shù)據(jù)來自多個(gè)權(quán)威的、包含分子-性質(zhì)對(duì)的生化數(shù)據(jù)庫(kù)如 Drugbank 和 PubChem。為了提高 MolTC 在不同分子交互場(chǎng)景下的泛化能力,我們對(duì)上述數(shù)據(jù)庫(kù)中的分子進(jìn)行隨機(jī)組合,來構(gòu)造不同的分子對(duì)。

隨后,在微調(diào)階段,針對(duì)定性分子交互分析任務(wù),Prompts 直接根據(jù)特定的下游任務(wù)進(jìn)行定制。而針對(duì)傳統(tǒng) LLMs 較難處理的定量分析任務(wù),下層的思維鏈指導(dǎo) MolTC 優(yōu)先為目標(biāo)數(shù)值預(yù)估一個(gè)大致的范圍,然后逐步將其細(xì)化到一個(gè)精確的值。以溶液-溶劑交互任務(wù)為例,其 Prompts 的設(shè)計(jì)如下:

wKgaomXb-xiAZAbwAAFjJa2wiP0534.jpg

動(dòng)態(tài)參數(shù)共享策略

為了提高上述訓(xùn)練范式的效率,MolTC 引入了一種新穎的參數(shù)共享策略。具體而言,我們首先考慮分子交互任務(wù)的以下關(guān)鍵屬性:

(1)交互中分子角色的重要性。例如,在溶液-溶劑交互場(chǎng)景中,水和乙醇互為溶劑會(huì)產(chǎn)生不同的能量釋放。某些時(shí)候,角色的顛倒甚至?xí)?dǎo)致交互反應(yīng)的停滯。

(2)交互中分子順序的重要性。例如,在藥物對(duì)交互場(chǎng)景中,藥物引入順序的不同可能會(huì)導(dǎo)致不同的治療效果。

(3)分子角色/順序帶來的特征重要性的差異。例如,在發(fā)色團(tuán)-溶液對(duì)中,一個(gè)化學(xué)基團(tuán)在溶液內(nèi)會(huì)對(duì)交互屬性產(chǎn)生關(guān)鍵的影響,但其在發(fā)色團(tuán)中時(shí),則可能對(duì)交互無足輕重。

wKgZomXb-xiAfUCpAAGMqSlMQhw455.jpg

▲ 圖2:應(yīng)用動(dòng)態(tài)參數(shù)共享策略后的的 MolTC 訓(xùn)練范式。其中,鏈環(huán)表示兩個(gè)模塊之間的參數(shù)共享;雪花表示參數(shù)凍結(jié);火焰表示參數(shù)更新。

這些屬性自然地啟發(fā) MolTC 適應(yīng)性地優(yōu)先考慮倆個(gè)分子內(nèi)的不同信息,即根據(jù)角色和順序?yàn)榉肿觿?chuàng)建獨(dú)特的編碼。具體而言,為了學(xué)習(xí)到這種差異性,同時(shí)維持分子對(duì)中學(xué)習(xí)到的共性信息的共享,我們引入了如下參數(shù)共享策略:

(1)考慮 Graph Encoder 專注于提取底層的分子圖結(jié)構(gòu),并未將語義與分子結(jié)構(gòu)進(jìn)行對(duì)齊,因此,在預(yù)訓(xùn)練和微調(diào)階段,MolTC 共享倆個(gè) Graph Encoder 的參數(shù),以增強(qiáng)其學(xué)習(xí)效率。

(2)考慮 Projector 專注于實(shí)現(xiàn)分子結(jié)構(gòu)與語義信息的對(duì)齊,因此,在預(yù)訓(xùn)練階段,MolTC 共享倆個(gè) Projector 的參數(shù)以提高系統(tǒng)的泛化性和魯棒性;在微調(diào)階段,MolTC 終止這一共享,實(shí)現(xiàn)根據(jù)不同下游任務(wù)中的分子角色和順序量身定制的語義映射。

MoT-instruction數(shù)據(jù)集開發(fā)

在 MolTC 的訓(xùn)練過程中,鑒于當(dāng)前缺乏一個(gè)通用的、為大模型分子關(guān)系學(xué)習(xí)量身定制的指令數(shù)據(jù)集,我們首先給出這一數(shù)據(jù)集應(yīng)當(dāng)滿足的關(guān)鍵性質(zhì):(1)它應(yīng)包含橫跨多個(gè)領(lǐng)域的、可以進(jìn)行交互的大量分子對(duì);(2)它應(yīng)詳細(xì)描述這些分子對(duì)中每個(gè)分子的重要生化屬性,以及(3)它應(yīng)根據(jù)思維鏈的形式闡述分子對(duì)的交互性質(zhì)。

具體來說,我們通過以下三步構(gòu)建上述 MoT-instructions 數(shù)據(jù)集:

(1)我們首先收集多個(gè)具有代表性的分子交互數(shù)據(jù)集,并從 DrugBank 和 PubChem 等權(quán)威生化數(shù)據(jù)庫(kù)中獲取這些交互所涉及分子的生化屬性;

(2)隨后,我們進(jìn)行最優(yōu)指令確定。具體而言,我們根據(jù)訓(xùn)練 MolTC 得到的預(yù)測(cè)性能作為指標(biāo),來對(duì)定量交互 instructions 中的數(shù)值區(qū)間進(jìn)行設(shè)定。并結(jié)合該值的統(tǒng)計(jì)數(shù)據(jù)(如均值和方差)得出最優(yōu)區(qū)間設(shè)定和統(tǒng)計(jì)數(shù)據(jù)之間的規(guī)律,推廣至更多的定量交互數(shù)據(jù)集中;

(3)最后,我們將交互涉及的每個(gè)屬性單獨(dú)抽取至一個(gè)獨(dú)立的數(shù)據(jù)空間,以在排除交互屬性中缺失值、模糊值的干擾下,不浪費(fèi)分子對(duì)所提供的其他有用信息。

實(shí)驗(yàn)

為了更全面地評(píng)估 MolTC 的有效性,我們將基線算法分為三類:基于 GNN 的、基于其他深度學(xué)習(xí)模型的以及基于 LLMs 的方法。部分定性和定量的實(shí)驗(yàn)結(jié)果如下表所示。更多結(jié)果如消融實(shí)驗(yàn)結(jié)果煩請(qǐng)移步我們的文章或代碼。

wKgaomXb-xiAAnDsAAKQuxqhQh8193.jpg

▲ 表1:定性實(shí)驗(yàn)結(jié)果(以藥物對(duì)交互任務(wù)為例)

wKgZomXb-xiAC2skAAKYl0_5Cng646.jpg

▲ 表2:定量實(shí)驗(yàn)結(jié)果(以溶液溶劑交互任務(wù)為例)




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3799

    瀏覽量

    138042
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    561

    瀏覽量

    10789
  • GNN
    GNN
    +關(guān)注

    關(guān)注

    1

    文章

    31

    瀏覽量

    6562
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    325

    瀏覽量

    838

原文標(biāo)題:MWC 2024 | 倒計(jì)時(shí)1天!Net5.5G智能云網(wǎng)即將全面發(fā)布,打造新一代數(shù)字基礎(chǔ)設(shè)施

文章出處:【微信號(hào):Huawei_Fixed,微信公眾號(hào):華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Net5.5G的四大技術(shù)亮點(diǎn)

    互聯(lián)網(wǎng)迎來AI大爆發(fā),誕生了個(gè)新名詞:新質(zhì)互聯(lián)網(wǎng),也稱為Net5.5G。它不是普通的網(wǎng)絡(luò)升級(jí),而是面向AI時(shí)代的全新網(wǎng)絡(luò)架構(gòu)。簡(jiǎn)單來說,它讓互聯(lián)網(wǎng)從連接“人”擴(kuò)展到連接人 + 設(shè)備 + 算力 + 數(shù)據(jù) + 空間。
    的頭像 發(fā)表于 07-01 17:06 ?316次閱讀

    華為開發(fā)者大會(huì)2025(HDC 2025)亮點(diǎn):華為發(fā)布盤古大模型5.5 宣布新一代昇騰AI服務(wù)上線

    HarmonyOS、昇騰AI服務(wù)、盤古大模型等最新科技創(chuàng)新成果。 在主題演講中,華為常務(wù)董事、華為計(jì)算CEO張平安宣布基于CloudMatrix384 超節(jié)點(diǎn)的新一代昇騰AI服務(wù)
    的頭像 發(fā)表于 06-20 20:19 ?2220次閱讀
    華為開發(fā)者大會(huì)2025(HDC 2025)亮點(diǎn):華為<b class='flag-5'>云</b><b class='flag-5'>發(fā)布</b>盤古大模型<b class='flag-5'>5.5</b> 宣布<b class='flag-5'>新一代</b>昇騰AI<b class='flag-5'>云</b>服務(wù)上線

    廣和通發(fā)布新一代AI語音智能體FiboVista

    近日,2025火山引擎Force原動(dòng)力大會(huì)正式開幕。廣和通發(fā)布新一代AI語音智能體FiboVista,并已率先應(yīng)用于車聯(lián)網(wǎng),成為智能駕駛的“用車伙伴”和“出行伴侶”。通過創(chuàng)新AI大模型
    的頭像 發(fā)表于 06-17 09:22 ?561次閱讀

    PoE交換機(jī)如何助力智慧城市基礎(chǔ)設(shè)施建設(shè)?

    隨著全球城市化的加速發(fā)展,智慧城市的概念正逐步成為現(xiàn)實(shí)。通過技術(shù)手段提升居民生活質(zhì)量、優(yōu)化城市運(yùn)營(yíng)并促進(jìn)可持續(xù)發(fā)展已成為趨勢(shì)。彈性且高效的網(wǎng)絡(luò)是智慧城市基礎(chǔ)設(shè)施的關(guān)鍵支撐,而以太網(wǎng)供電(PoE
    發(fā)表于 03-25 10:20

    華為打造移動(dòng)AI時(shí)代領(lǐng)先電信基礎(chǔ)設(shè)施

    使能平臺(tái),助力運(yùn)營(yíng)商電信基礎(chǔ)設(shè)施從架構(gòu)、自動(dòng)化、綠色、AI等方面全面升級(jí),從容應(yīng)對(duì)復(fù)雜網(wǎng)絡(luò)挑戰(zhàn),使能AI業(yè)務(wù)創(chuàng)新,打造移動(dòng)AI時(shí)代領(lǐng)先電信基礎(chǔ)設(shè)施。 從電報(bào)、電話、移動(dòng)通信、移動(dòng)互聯(lián)網(wǎng)
    的頭像 發(fā)表于 03-08 11:39 ?741次閱讀

    華為亮相2025 WBBA網(wǎng)寬帶發(fā)展大會(huì)

    在MWC25巴塞羅那期間,由WBBA主辦的網(wǎng)寬帶發(fā)展大會(huì)(Broadband Development Congress, BDC)成功舉辦。本次峰會(huì)以“下一代互聯(lián)網(wǎng)演進(jìn),邁向智能化時(shí)
    的頭像 發(fā)表于 03-06 11:20 ?579次閱讀

    全球產(chǎn)業(yè)界共同發(fā)布Net5.5G網(wǎng)絡(luò)最佳實(shí)踐白皮書

    以"下一代互聯(lián)網(wǎng)演進(jìn),邁向智能化時(shí)代"為主題,吸引了來自全球產(chǎn)業(yè)組織、標(biāo)準(zhǔn)組織、政府機(jī)構(gòu)、運(yùn)營(yíng)商、設(shè)備商等200余位行業(yè)領(lǐng)袖齊聚堂,共同探討Net5.5G演進(jìn)方向、網(wǎng)絡(luò)技術(shù)創(chuàng)新、商用
    的頭像 發(fā)表于 03-05 14:40 ?295次閱讀
    全球產(chǎn)業(yè)界共同<b class='flag-5'>發(fā)布</b><b class='flag-5'>Net5.5G</b>網(wǎng)絡(luò)最佳實(shí)踐白皮書

    華為攜手產(chǎn)業(yè)伙伴打造一代智能電信基礎(chǔ)設(shè)施

    NFV是電信行業(yè)變革的重要催化劑,2012年NFV愿景白皮書的發(fā)布和ETSI NFV標(biāo)準(zhǔn)組織的成立,標(biāo)志著電信行業(yè)新時(shí)代的開始。歷經(jīng)十年發(fā)展,基于虛擬機(jī)的電信網(wǎng)絡(luò)化取得了令人矚目的成就,業(yè)已成為5G
    的頭像 發(fā)表于 02-24 17:00 ?480次閱讀

    Garmin佳明和天馬推出新一代數(shù)字座艙解決方案

    即將開幕的國(guó)際消費(fèi)電子展(CES 2025)上,Garmin佳明推出全新一代數(shù)字座艙解決方案Garmin Unified Cabin 2025。該方案配備了天馬多款車規(guī)級(jí)顯示屏,其中包括款采用多屏全貼合技術(shù)的全新超寬顯示屏,
    的頭像 發(fā)表于 01-07 16:16 ?868次閱讀

    Garmin佳明和高通推出新一代數(shù)字座艙解決方案

    Garmin佳明和高通技術(shù)公司在2025年國(guó)際消費(fèi)電子展(CES 2025)上宣布,雙方將擴(kuò)展在汽車技術(shù)領(lǐng)域的合作,推出全新一代數(shù)字座艙解決方案Garmin Unified Cabin 2025,可基于單個(gè)Garmin控制模組提供可擴(kuò)展的域控制器功能。
    的頭像 發(fā)表于 01-07 10:38 ?773次閱讀

    互聯(lián)網(wǎng)演進(jìn)跨越半世紀(jì),智能化時(shí)代呼喚Net5.5G網(wǎng)絡(luò)新代際

    沿著Net5.5G的方向加速前行,抵達(dá)充滿數(shù)字黃金機(jī)遇的新大陸
    的頭像 發(fā)表于 11-18 09:37 ?2497次閱讀
    互聯(lián)網(wǎng)演進(jìn)跨越半世紀(jì),<b class='flag-5'>智能</b>化時(shí)代呼喚<b class='flag-5'>Net5.5G</b>網(wǎng)絡(luò)新代際

    Net5.5G智能IP網(wǎng)絡(luò)峰會(huì)成功舉辦,全球Net5.5G加速商用部署

    上,全球領(lǐng)先運(yùn)營(yíng)商,產(chǎn)業(yè)組織,政府機(jī)構(gòu)及設(shè)備廠商齊聚堂,分享Net5.5G IP承載網(wǎng)演進(jìn)和產(chǎn)業(yè)數(shù)字化演進(jìn)新業(yè)務(wù)實(shí)踐,啟動(dòng)全球Net5.5G
    的頭像 發(fā)表于 11-05 09:55 ?561次閱讀
    <b class='flag-5'>Net5.5G</b><b class='flag-5'>智能</b>IP網(wǎng)絡(luò)峰會(huì)成功舉辦,全球<b class='flag-5'>Net5.5G</b>加速商用部署

    華為推出面向Net5.5G的星河AI網(wǎng)絡(luò)解決方案

    今日,全球超寬帶高峰論壇(UBBF 2024)期間,華為數(shù)據(jù)通信產(chǎn)品線總裁王雷發(fā)表了題為“星河AI網(wǎng)絡(luò):全面邁入Net5.5G,加速運(yùn)營(yíng)商新增長(zhǎng)”的主題演講,分享了華為攜手全球領(lǐng)先運(yùn)營(yíng)商通過星河AI網(wǎng)絡(luò)解決方案助力客戶商業(yè)成功的具體實(shí)踐,并展望了智算場(chǎng)景下新業(yè)務(wù)的現(xiàn)有實(shí)踐
    的頭像 發(fā)表于 11-04 16:05 ?823次閱讀

    華為亮相Net5.5G智能IP網(wǎng)絡(luò)峰會(huì)

    由聯(lián)合國(guó)寬帶委員會(huì)、全球網(wǎng)寬帶產(chǎn)業(yè)協(xié)會(huì)(WBBA)和華為共同舉辦的第十屆全球超寬帶高峰論壇(UBBF 2024)期間,在以“Net5.5G加速部署,邁向智能化時(shí)代”為主題的
    的頭像 發(fā)表于 11-04 15:39 ?704次閱讀

    智能駕駛所需的基礎(chǔ)設(shè)施

    智能駕駛所需的基礎(chǔ)設(shè)施主要包括以下幾個(gè)方面: 、通信網(wǎng)絡(luò)基礎(chǔ)設(shè)施 5G/6G網(wǎng)絡(luò) :高速、低延
    的頭像 發(fā)表于 10-23 16:05 ?1702次閱讀