剛剛,哥倫比亞大學(xué)系統(tǒng)生物學(xué)助理教授 Mohammed AlQuraishi 在推特上宣布,他們從頭訓(xùn)練了一個(gè)名為 OpenFold 的模型,該模型是 AlphaFold2 的可訓(xùn)練 PyTorch 復(fù)現(xiàn)版本。Mohammed AlQuraishi 還表示,這是第一個(gè)大眾可用的 AlphaFold2 復(fù)現(xiàn)。
- 短序列推理:加快了在 GPU 上推理少于 1500 個(gè)氨基酸殘基的鏈的速度;
- 長(zhǎng)序列推理:通過(guò)該研究實(shí)現(xiàn)的低記憶注意力(low-memory attention)對(duì)極長(zhǎng)鏈進(jìn)行推理,OpenFold 可以在單個(gè) A100 上預(yù)測(cè) 超過(guò) 4000 個(gè)殘基的序列結(jié)構(gòu),借助 CPU offload 甚至可以預(yù)測(cè)更長(zhǎng)的序列;
- 內(nèi)存高效在訓(xùn)練和推理期間,在 FastFold 內(nèi)核基礎(chǔ)上修改的自定義 CUDA 注意力內(nèi)核,使用的 GPU 內(nèi)存分別比等效的 FastFold 和現(xiàn)有的 PyTorch 實(shí)現(xiàn)少 4 倍和 5 倍;
- 高效對(duì)齊腳本:該團(tuán)隊(duì)使用原始 AlphaFold HHblits/JackHMMER pipeline 或帶有 MMseqs2 的 ColabFold,已經(jīng)生成了數(shù)百萬(wàn)個(gè)對(duì)齊。
scripts/install_third_party_dependencies.sh
使用如下命令激活環(huán)境:
sourcescripts/activate_conda_env.sh
停用命令:
sourcescripts/deactivate_conda_env.sh
在激活環(huán)境下,編譯 OpenFold 的 CUDA 內(nèi)核
python3setup.pyinstall
在 / usr/bin 路徑下安裝 HH-suite:
#scripts/install_hh_suite.sh
使用如下命令可以下載用于訓(xùn)練 OpenFold 和 AlphaFold 的數(shù)據(jù)庫(kù):
bashscripts/download_data.shdata/
如果要使用一組 DeepMind 的預(yù)訓(xùn)練參數(shù)對(duì)一個(gè)或多個(gè)序列進(jìn)行推理,可以運(yùn)行如下代碼:
python3run_pretrained_openfold.py
fasta_dir
data/pdb_mmcif/mmcif_files/
--uniref90_database_pathdata/uniref90/uniref90.fasta
--mgnify_database_pathdata/mgnify/mgy_clusters_2018_12.fa
--pdb70_database_pathdata/pdb70/pdb70
--uniclust30_database_pathdata/uniclust30/uniclust30_2018_08/uniclust30_2018_08
--output_dir./
--bfd_database_pathdata/bfd/bfd_metaclust_clu_complete_id30_c90_final_seq.sorted_opt
--model_device"cuda:0"
--jackhmmer_binary_pathlib/conda/envs/openfold_venv/bin/jackhmmer
--hhblits_binary_pathlib/conda/envs/openfold_venv/bin/hhblits
--hhsearch_binary_pathlib/conda/envs/openfold_venv/bin/hhsearch
--kalign_binary_pathlib/conda/envs/openfold_venv/bin/kalign
--config_preset"model_1_ptm"
--openfold_checkpoint_pathopenfold/resources/openfold_params/finetuning_2_ptm.pt
更多細(xì)節(jié)請(qǐng)參見(jiàn) GitHub:https://github.com/aqlaboratory/openfold
-
算法
+關(guān)注
關(guān)注
23文章
4710瀏覽量
95412 -
開(kāi)源
+關(guān)注
關(guān)注
3文章
3690瀏覽量
43840 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5561瀏覽量
122805
原文標(biāo)題:首個(gè)大眾可用PyTorch版AlphaFold2復(fù)現(xiàn),哥大開(kāi)源OpenFold,star量破千
文章出處:【微信號(hào):CVSCHOOL,微信公眾號(hào):OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
求教:樹(shù)莓派和arduino的通信
【NanoPi M2試用體驗(yàn)】NanoPi M2 debian簡(jiǎn)單認(rèn)識(shí)和疑問(wèn)
【從0教學(xué)嵌入式Linux】第十七集
【從0教學(xué)嵌入式Linux】第三十二集
Linux系統(tǒng)下安裝ISO文件
如何在Linux系統(tǒng)下安裝Perl腳本語(yǔ)言
最新版CCS7.3.0_官方軟件下載

安裝Linux系統(tǒng)對(duì)硬件有什么要求

Linux下Apache服務(wù)器的安裝和配置

評(píng)論