鑒于許多疾病機(jī)理不明確或者發(fā)病機(jī)制涉及多條信號通路,基于靶點的藥物開發(fā)策略存在一定的局限性。因此,開發(fā)一種不依賴于靶點,可以直接預(yù)測藥效的計算模型似乎是一種解決方案,以往的研究人員已經(jīng)進(jìn)行了嘗試,但是建立的模型往往針對一種疾病有效,缺乏普適性。
由于大部分疾病都會表現(xiàn)出基因表達(dá)譜的變化,研究人員利用化合物誘導(dǎo)的基因表達(dá)譜變化作為中間指標(biāo)進(jìn)行藥效預(yù)測,開發(fā)出了一種基于基因表達(dá)譜變化直接預(yù)測藥效的計算模型,這種模型適用于多種疾病研究和相關(guān)藥物研發(fā)。
6 月 17 日,北京大學(xué)謝正偉團(tuán)隊在 Nature Biotechnology 在線發(fā)表了這項研究。在這項研究中,他們詳細(xì)介紹了這種基于基因指紋和深度學(xué)習(xí)的藥效預(yù)測系統(tǒng)(DLEPS,中文名靈素系統(tǒng)),并證明了 DLEPS 是一種藥物發(fā)現(xiàn)和重定位的有效工具。在論文中,他們針對 3 種代謝性疾病開發(fā)了重定位和全新化合物分子。
有審稿人稱,靈素系統(tǒng)是一個高度原創(chuàng)的解決方案,也是第一個被報道用神經(jīng)網(wǎng)絡(luò)連接化合物結(jié)構(gòu)和基因表達(dá)譜的研究。
“這項工作初步完成了我的期望和設(shè)想”,謝正偉告訴生輝。
借此,生輝獨(dú)家專訪了該研究的共同通訊作者謝正偉博士。
今年是謝正偉獨(dú)立開展科研活動的第五個年頭。他現(xiàn)在是北京大學(xué)醫(yī)學(xué)部的副研究員以及獨(dú)立實驗室負(fù)責(zé)人,長期從事基于多學(xué)科交叉和人工智能的創(chuàng)新藥物算法開發(fā),以及細(xì)胞衰老機(jī)制的研究。此前,他從事純計算的研究工作,開發(fā)過微流芯片,并與諾獎得主 Elizabeth H.Blackburn 共同合作在 Cell 發(fā)表過論文。
2018 年,他創(chuàng)立了億藥科技,利用 AI 和深度學(xué)習(xí)加速藥物研發(fā)。據(jù)謝正偉透露,億藥科技擁有一支多學(xué)科交叉創(chuàng)始團(tuán)隊,具有從頭開發(fā)算法的能力,同時也有分子細(xì)胞生物學(xué)、結(jié)構(gòu)生物學(xué)研究能力。目前團(tuán)隊規(guī)模 20 人左右,專業(yè)涵蓋藥理學(xué)、人工智能、藥物化學(xué)、藥理驗證等。
利用 “基因指紋” 預(yù)測分子性能
多種疾病特別是年齡、代謝相關(guān)疾病的發(fā)生和發(fā)展都是由于系統(tǒng)失衡造成的基因表達(dá)紊亂,通過檢測 “基因指紋” 即基因表達(dá)譜可以觀察和研究疾病變化。
一方面,基因表達(dá)譜的檢測可以應(yīng)用于疾病生物標(biāo)記物的篩選;另一方面,基因表達(dá)譜的檢測也可以為基因功能研究提供線索,揭示疾病發(fā)生發(fā)展的分子機(jī)制。
在論文中,科研人員開發(fā)的靈素系統(tǒng)正是利用基因表達(dá)變化譜為中間指標(biāo)建立了預(yù)測藥效的計算模型,與傳統(tǒng)連接圖方法相比,這種模型適用于沒有實驗數(shù)據(jù)或者未發(fā)現(xiàn)的藥物分子。而連接圖方法雖然采用基因表達(dá)譜變化為指標(biāo),但是這種方法往往只適用于已有實驗數(shù)據(jù)的分子,對于新分子束手無策。
在該研究中,他們首先構(gòu)建了神經(jīng)網(wǎng)絡(luò),使用 SMILES 化學(xué)編碼輸入,將小分子在高維空間進(jìn)行編碼,高維空間的坐標(biāo)向量進(jìn)一步預(yù)測 1000 個標(biāo)記基因,然后對超過 1 萬個基因進(jìn)行預(yù)測;緊接著,他們用疾病相關(guān)基因指紋來反映特定疾病的 “內(nèi)在痕跡”,并且使用基因集合富集分析 (GSEA) 來評估化合物對疾病的潛在療效。
SMILES 即簡化分子線性輸入規(guī)范,這是一種用 ASCII 字符串明確描述分子結(jié)構(gòu)的規(guī)范。GSEA:是一種分析基因表達(dá)信息的方法。
謝正偉團(tuán)隊將這種方法和模型稱為基于深度學(xué)習(xí)的藥效預(yù)測系統(tǒng) —— 靈素系統(tǒng)。在預(yù)測基因表達(dá)變化部分,系統(tǒng)可以準(zhǔn)確預(yù)測新分子對轉(zhuǎn)錄組造成的影響,訓(xùn)練集和測試集中預(yù)測的和真實的基因表達(dá)譜變化的平均相關(guān)性為 0.90 和 0.74,分布峰值分別在為 0.93 和 0.90。
這些指標(biāo)說明系統(tǒng)成功地從已有數(shù)據(jù)中學(xué)習(xí)到深層次的分子結(jié)構(gòu) - 基因表達(dá)譜變化之間的關(guān)聯(lián),達(dá)到了外推到虛擬分子的效果。
“靈素系統(tǒng)在測試集上的優(yōu)異表現(xiàn),使我們相信靈素系統(tǒng)對于新結(jié)構(gòu)分子,也可以取得準(zhǔn)確的預(yù)測結(jié)果”,謝正偉說。
接下來,研究人員深入探索了測試集的一部分分子,這些分子在訓(xùn)練集中沒有非常相似的分子。
“我們發(fā)現(xiàn),靈素系統(tǒng)可以精確預(yù)測新結(jié)構(gòu)小分子誘導(dǎo)的基因表達(dá)譜變化(平均相關(guān)性 0.6)。同時,系統(tǒng)還可以準(zhǔn)確區(qū)分結(jié)構(gòu)非常相似的小分子(只差一個基團(tuán))誘導(dǎo)的基因表達(dá)譜差異”,謝正偉補(bǔ)充道。
研究人員還分析出了哪些基團(tuán)傾向于保持表達(dá)譜不變或者更傾向于改變,這些分析對于后續(xù)的藥物設(shè)計至關(guān)重要。
謝正偉告訴生輝,與傳統(tǒng)基于靶點的方法或者單基因標(biāo)記篩選方法相比,靈素系統(tǒng)具有三大優(yōu)勢:
一是,靈素系統(tǒng)同時考慮多個基因指標(biāo),精度更高。靈素系統(tǒng)更加靈活,僅基于基因指紋就可預(yù)測候選分子,可以在復(fù)雜疾病上得到更好藥效的化合物,更快的找到工具分子。
二是,靈素系統(tǒng)不需要預(yù)先合成實體分子庫,大大的降低了成本和工作量,效率更高。
三是,找到小分子以后可以進(jìn)一步發(fā)現(xiàn)疾病的新靶點,從而實現(xiàn)在藥效預(yù)測和靶點上開發(fā)雙管齊下、同步進(jìn)行。
具有通用性,可預(yù)測多種疾病藥物分子
“第一次看到這么好的擬合效果,我驚訝得半天說不出話來。不過,系統(tǒng)是否真正有用還得在實踐中驗證。由于動物實驗周期長,驗證的病種多,我們光驗證就花了兩年的時間”,謝正偉說。
在實驗驗證方面,謝正偉遇到了北京大學(xué)基礎(chǔ)醫(yī)學(xué)部鄭瑞茂研究員,鄭瑞茂當(dāng)時正在測試?yán)坠偎兀@是一個和連接圖方法有淵源的分子。
兩人一拍即合, 一番交流之后,鄭瑞茂很快理解了靈素系統(tǒng)的潛在價值,并在促進(jìn)脂肪褐變和減肥領(lǐng)域進(jìn)行了嘗試。
他們利用靈素系統(tǒng)預(yù)測了四個化合物,其中三個化合物可降低小鼠的脂肪含量,并且誘導(dǎo)數(shù)十個褐變基因表達(dá)上調(diào),使白色脂肪組織變成棕色脂肪組織,減輕了小鼠的體重,達(dá)到了減肥目的。
“這大大增強(qiáng)了我們的信心,然后我們繼續(xù)嘗試擴(kuò)展到其他的領(lǐng)域”,謝正偉說。
據(jù)謝正偉透露,針對高尿酸血癥,靈素系統(tǒng)成功預(yù)測了天然產(chǎn)物紫蘇烯,其可降低血清尿酸,效果上優(yōu)于四種陽性藥物,還具有抗炎和抗纖維化的優(yōu)勢。
針對非酒精性脂肪性肝炎(NASH),他們發(fā)現(xiàn)三種可緩解 NASH 進(jìn)展的 MEK-ERK 信號通路抑制劑,并首次揭示了 MEK-ERK 通路在 NASH 中的重要作用。NASH 是一種在全球范圍內(nèi)十分普遍的慢性肝病,NASH 患者 10 年內(nèi)肝硬化發(fā)生率高達(dá) 25%,市場需求巨大。吉利德、武田等制藥大廠紛紛重金布局該領(lǐng)域,然而目前全球尚無一款藥物獲批上市。
“針對 NASH 適應(yīng)癥,我們發(fā)現(xiàn)至少需要調(diào)節(jié)七個通路才能取得良好的治療效果,而這正是靈素系統(tǒng)所擅長的”,謝正偉說。
SaaS 服務(wù)基礎(chǔ)上做自研
2016 年,謝正偉在北京大學(xué)醫(yī)學(xué)院建立獨(dú)立實驗室,立志研發(fā)抗衰老藥物。
“當(dāng)時我們已經(jīng)建立了一套高通量篩選系統(tǒng),但是篩選效率低,無法滿足針對多種疾病篩選藥物分子的需求。我希望通過 AI 和深度學(xué)習(xí)預(yù)測化合物性能,尋找一些可以抗衰老的化合物,于是開發(fā)了這套靈素系統(tǒng)”,謝正偉說。
2018 年,謝正偉正式落地億藥科技,將自己的科研成果轉(zhuǎn)化為 “藥”。同年,億藥科技完成了種子輪融資。
據(jù)謝正偉介紹,論文中只提到了 3 種代謝性疾病,實際上,他們還在探索肌腱愈合、骨質(zhì)疏松、長壽等領(lǐng)域的潛力,現(xiàn)在已經(jīng)找到了長壽的化合物。借助于研發(fā)優(yōu)勢,億藥科技還開發(fā)了一條替代 GLP-1 的 “爆款” 管線。GLP-1 是 2 型糖尿病藥物的主要作用靶點,GLP-1 類藥物是糖尿病和減肥領(lǐng)域最閃耀的藥物之一。
基于一系列的研究成果,億藥科技已經(jīng)搭建了多條創(chuàng)新管線和 “老藥新用” 管線,并且申請了十幾個相關(guān)的專利。
藥物發(fā)現(xiàn)處于整個生物醫(yī)藥產(chǎn)業(yè)鏈最前端,也是產(chǎn)生核心專利階段。據(jù)了解,論文中涉及的小分子 - 神經(jīng)網(wǎng)絡(luò) - 基因表達(dá)變化 - 藥效的算法框架已經(jīng)申請國內(nèi)外專利。
“對我們來說,這個專利的優(yōu)先權(quán)具有非常重大的意義和保護(hù)作用。因為它的出發(fā)點是一個原始創(chuàng)新的框架,所以保護(hù)范圍非常大,能夠幫助億藥科技建立專利壁壘和保持競爭優(yōu)勢”,謝正偉說。
謝正偉告訴生輝,一家 AI 制藥公司的核心競爭力,主要體現(xiàn)在商業(yè)發(fā)展上,可以簡單歸結(jié)為兩個指標(biāo)。第一個指標(biāo)是做技術(shù)服務(wù)的能力,是否能拿到大公司的訂單;另一個指標(biāo)是自研管線,是否有成為創(chuàng)新型研發(fā)中心以及未來成為藥企的潛力。
基于靈素系統(tǒng)以及搭建的人工智能平臺、藥物化學(xué)平臺、藥理驗證平臺,億藥科技最近拿到中國科學(xué)院以及一家頭部藥企的訂單合同。
“我們的商業(yè)模式可以簡單歸結(jié)為 3 種,一是提供 SaaS 平臺付費(fèi)計算服務(wù),二是提供化合物篩選等技術(shù)服務(wù),三是自有管線的研發(fā)”,謝正偉說。
目前,億藥科技正在進(jìn)行 Pre-A 輪融資,本輪融資將會用于自有管線研發(fā)、平臺建設(shè)、隊伍擴(kuò)充和管線的 IND 推進(jìn)。
“做藥一直是我們的初衷,我希望億藥科技成為一家 AI + 大數(shù)據(jù)驅(qū)動的科研型制藥公司。未來,我們會在提供 SaaS 服務(wù)和技術(shù)服務(wù)的基礎(chǔ)上,注重推動自研管線,并將這些管線推向臨床、推向市場,最終使患者受益”,謝正偉這樣描述億藥科技未來的發(fā)展規(guī)劃。
編輯:jq
-
AI
+關(guān)注
關(guān)注
88文章
35137瀏覽量
279797 -
人工智能
+關(guān)注
關(guān)注
1806文章
49014瀏覽量
249454 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5561瀏覽量
122794
原文標(biāo)題:基于基因指紋的藥效預(yù)測新模型登頂刊,這家AI制藥初創(chuàng)瞄準(zhǔn)衰老代謝疾病丨專訪億藥科技
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
大模型推理顯存和計算量估計方法研究
《中國電機(jī)工程學(xué)報》網(wǎng)絡(luò)首發(fā)論文:基于數(shù)據(jù)驅(qū)動觀測器的永磁同步電機(jī)顯式模型預(yù)測直接速度控制
請問是否可以在模型服務(wù)器中使用REST請求OpenVINO?預(yù)測?
一種新型半導(dǎo)體光放大器設(shè)計(1)

信道預(yù)測模型在數(shù)據(jù)通信中的作用
AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測模型
一種新型機(jī)翼應(yīng)變載荷關(guān)系神經(jīng)網(wǎng)絡(luò)模型

一種創(chuàng)新的動態(tài)軌跡預(yù)測方法

評論