高通量測(cè)序技術(shù)(High-throughput sequencing)又稱“下一代”測(cè)序技術(shù)(“Next-generation” sequencing technology),以能一次并行對(duì)幾十萬(wàn)到幾百萬(wàn)條DNA分子進(jìn)行序列測(cè)定和一般讀長(zhǎng)較短等為標(biāo)志。
高通量測(cè)序技術(shù)應(yīng)用
測(cè)序技術(shù)推進(jìn)科學(xué)研究的發(fā)展。隨著第二代測(cè)序技術(shù)的迅猛發(fā)展,科學(xué)界也開(kāi)始越來(lái)越多地應(yīng)用第二代測(cè)序技術(shù)來(lái)解決生物學(xué)問(wèn)題。比如在基因組水平上對(duì)還沒(méi)有參考序列的物種進(jìn)行從頭測(cè)序(de novo sequencing),獲得該物種的參考序列,為后續(xù)研究和分子育種奠定基礎(chǔ);對(duì)有參考序列的物種,進(jìn)行全基因組重測(cè)序(resequencing),在全基因組水平上掃描并檢測(cè)突變位點(diǎn),發(fā)現(xiàn)個(gè)體差異的分子基礎(chǔ)。在轉(zhuǎn)錄組水平上進(jìn)行全轉(zhuǎn)錄組測(cè)序(whole transcriptome resequencing),從而開(kāi)展可變剪接、編碼序列單核苷酸多態(tài)性(cSNP)等研究;或者進(jìn)行小分子RNA測(cè)序(small RNA sequencing),通過(guò)分離特定大小的RNA分子進(jìn)行測(cè)序,從而發(fā)現(xiàn)新的microRNA分子。在轉(zhuǎn)錄組水平上,與染色質(zhì)免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技術(shù)相結(jié)合,從而檢測(cè)出與特定轉(zhuǎn)錄因子結(jié)合的DNA區(qū)域和基因組上的甲基化位點(diǎn)。
這邊需要特別指出的是第二代測(cè)序結(jié)合微陣列技術(shù)而衍生出來(lái)的應(yīng)用--目標(biāo)序列捕獲測(cè)序技術(shù)(Targeted Resequencing)。這項(xiàng)技術(shù)首先利用微陣列技術(shù)合成大量寡核苷酸探針,這些寡核苷酸探針能夠與基因組上的特定區(qū)域互補(bǔ)結(jié)合,從而富集到特定區(qū)段,然后用第二代測(cè)序技術(shù)對(duì)這些區(qū)段進(jìn)行測(cè)序。目前提供序列捕獲的廠家有Agilent和Nimblegen ,應(yīng)用最多的是人全外顯子組捕獲測(cè)序??茖W(xué)家們目前認(rèn)為外顯子組測(cè)序比全基因組重測(cè)序更有優(yōu)勢(shì),不僅僅是費(fèi)用較低,更是因?yàn)橥怙@子組測(cè)序的數(shù)據(jù)分析計(jì)算量較小,與生物學(xué)表型結(jié)合更為直接。
目前,高通量測(cè)序開(kāi)始廣泛應(yīng)用于尋找疾病的候選基因上。內(nèi)梅亨大學(xué)的研究人員使用這種方法鑒定出Schinzel-Giedion 綜合征中的致病突變,Schinzel-Giedion綜合征是一種導(dǎo)致嚴(yán)重的智力缺陷、腫瘤高發(fā)以及多種先天性畸形的罕見(jiàn)病。他們使用Agilent SureSelect序列捕獲和SOLiD對(duì)四位患者的外顯子組進(jìn)行測(cè)序,平均覆蓋度為43倍,讀長(zhǎng)為50 nt,每個(gè)個(gè)體產(chǎn)生了2.7-3 GB可作圖的序列數(shù)據(jù)。他們聚焦于全部四位患者都攜帶變異體的12個(gè)基因,最終將候選基因縮小至1個(gè)。而貝勒醫(yī)學(xué)院基因組測(cè)序中心也計(jì)劃對(duì)15種以Science雜志年度十大科學(xué)突破上疾病進(jìn)行研究,包括腦癌、肝癌、胰腺癌、結(jié)腸癌、卵巢癌、膀胱癌、心臟病、糖尿病、自閉癥以及其他遺傳疾病,以更好地理解致病突變以及突變對(duì)疾病的影響。前不久剛剛結(jié)束的評(píng)選中,外顯子組測(cè)序名列其中。
以上我們盤(pán)點(diǎn)了2010年第二代測(cè)序技術(shù)的最新進(jìn)展和相關(guān)應(yīng)用。但是除了第二代測(cè)序之外,還有另外一種以單分子實(shí)時(shí)測(cè)序和納米孔為標(biāo)志的第三代測(cè)序技術(shù)也正在如火如荼的發(fā)展中,只是還沒(méi)有正式發(fā)布。所以目前科學(xué)界所說(shuō)的高通量測(cè)序還指的是第二代測(cè)序。
一、測(cè)序技術(shù)發(fā)展現(xiàn)狀
根據(jù)發(fā)展歷史、影響力、測(cè)序原理和技術(shù)不同等,主要有以下幾種:大規(guī)模平行簽名測(cè)序(MassivelyParallel Signature Sequencing, MPSS)、聚合酶克?。≒olony Sequencing)、454焦磷酸測(cè)序(454 pyrosequencing)、Illumina(Solexa)sequencing、ABI SOLiD sequencing、離子半導(dǎo)體測(cè)序(Ion semiconductor sequencing)、DNA納米球測(cè)序 (DNA nanoballsequencing)等。
隨著第二代測(cè)序技術(shù)的迅猛發(fā)展,科學(xué)界也開(kāi)始越來(lái)越多地應(yīng)用第二代測(cè)序技術(shù)來(lái)解決生物學(xué)問(wèn)題。比如在基因組水平上對(duì)還沒(méi)有參考序列的物種進(jìn)行重頭測(cè)序(de novosequencing),獲得該物種的參考序列,為后續(xù)研究和分子育種奠定基礎(chǔ);對(duì)有參考序列的物種,進(jìn)行全基因組重測(cè)序(resequencing),在全基因組水平上掃描并檢測(cè)突變位點(diǎn),發(fā)現(xiàn)個(gè)體差異的分子基礎(chǔ)。在轉(zhuǎn)錄組水平上進(jìn)行全轉(zhuǎn)錄組測(cè)序(wholetranscriptome resequencing),從而開(kāi)展可變剪接、編碼序列單核苷酸多態(tài)性(cSNP)等研究;或者進(jìn)行小分子RNA測(cè)序(small RNAsequencing),通過(guò)分離特定大小的RNA分子進(jìn)行測(cè)序,從而發(fā)現(xiàn)新的microRNA分子。在轉(zhuǎn)錄組水平上,與染色質(zhì)免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技術(shù)相結(jié)合,從而檢測(cè)出與特定轉(zhuǎn)錄因子結(jié)合的DNA區(qū)域和基因組上的甲基化位點(diǎn)。
二、高通量測(cè)序技術(shù)的應(yīng)用
測(cè)序技術(shù)推進(jìn)科學(xué)研究的發(fā)展。隨著第二代測(cè)序技術(shù)的迅猛發(fā)展,科學(xué)界也開(kāi)始越來(lái)越多地應(yīng)用第二代測(cè)序技術(shù)來(lái)解決生物學(xué)問(wèn)題。比如在基因組水平上對(duì)還沒(méi)有參考序列的物種進(jìn)行重頭測(cè)序(de novosequencing),獲得該物種的參考序列,為后續(xù)研究和分子育種奠定基礎(chǔ);對(duì)有參考序列的物種,進(jìn)行全基因組重測(cè)序(resequencing),在全基因組水平上掃描并檢測(cè)突變位點(diǎn),發(fā)現(xiàn)個(gè)體差異的分子基礎(chǔ)。在轉(zhuǎn)錄組水平上進(jìn)行全轉(zhuǎn)錄組測(cè)序(whole transcriptomeresequencing),從而開(kāi)展可變剪接、編碼序列單核苷酸多態(tài)性(cSNP)等研究;或者進(jìn)行小分子RNA測(cè)序(small RNA sequencing),通過(guò)分離特定大小的RNA分子進(jìn)行測(cè)序,從而發(fā)現(xiàn)新的microRNA分子。在轉(zhuǎn)錄組水平上,與染色質(zhì)免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技術(shù)相結(jié)合,從而檢測(cè)出與特定轉(zhuǎn)錄因子結(jié)合的DNA區(qū)域和基因組上的甲基化位點(diǎn)。
需要特別指出的是第二代測(cè)序結(jié)合微陣列技術(shù)而衍生出來(lái)的應(yīng)用--目標(biāo)序列捕獲測(cè)序技術(shù)(Targeted Resequencing)。這項(xiàng)技術(shù)首先利用微陣列技術(shù)合成大量寡核苷酸探針,這些寡核苷酸探針能夠與基因組上的特定區(qū)域互補(bǔ)結(jié)合,從而富集到特定區(qū)段,然后用第二代測(cè)序技術(shù)對(duì)這些區(qū)段進(jìn)行測(cè)序。目前提供序列捕獲的廠家有Agilent和Nimblegen,應(yīng)用最多的是人全外顯子組捕獲測(cè)序??茖W(xué)家們目前認(rèn)為外顯子組測(cè)序比全基因組重測(cè)序更有優(yōu)勢(shì),不僅僅是費(fèi)用較低,更是因?yàn)橥怙@子組測(cè)序的數(shù)據(jù)分析計(jì)算量較小,與生物學(xué)表型結(jié)合更為直接。
目前,高通量測(cè)序開(kāi)始廣泛應(yīng)用于尋找疾病的候選基因上。內(nèi)梅亨大學(xué)的研究人員使用這種方法鑒定出Schinzel-Giedion 綜合征中的致病突變,Schinzel-Giedion綜合征是一種導(dǎo)致嚴(yán)重的智力缺陷、腫瘤高發(fā)以及多種先天性畸形的罕見(jiàn)病。他們使用AgilentSureSelect序列捕獲和SOLiD對(duì)四位患者的外顯子組進(jìn)行測(cè)序,平均覆蓋度為43倍,讀長(zhǎng)為50 nt,每個(gè)個(gè)體產(chǎn)生了2.7-3GB可作圖的序列數(shù)據(jù)。他們聚焦于全部四位患者都攜帶變異體的12個(gè)基因,最終將候選基因縮小至1個(gè)。而貝勒醫(yī)學(xué)院基因組測(cè)序中心也計(jì)劃對(duì)15種以上疾病進(jìn)行研究,包括腦癌、肝癌、胰腺癌、結(jié)腸癌、卵巢癌、膀胱癌、心臟病、糖尿病、自閉癥以及其他遺傳疾病,以更好地理解致病突變以及突變對(duì)疾病的影響。前不久剛剛結(jié)束的Science雜志年度十大科學(xué)突破評(píng)選中,外顯子組測(cè)序名列其中。
三、測(cè)序技術(shù)總結(jié)與展望
第一代測(cè)序技術(shù)憑借其長(zhǎng)的序列片段和高的準(zhǔn)確率,適合對(duì)新物種進(jìn)行基因組長(zhǎng)距框架的搭建以及后期GAP填補(bǔ),但是成本昂貴,而且難以勝任微量DNA樣品的測(cè)序工作。第二代測(cè)序技術(shù)中,454序列片段最長(zhǎng),比較適合對(duì)未知基因組從頭測(cè)序,搭建主體結(jié)構(gòu),但是在判斷連續(xù)單堿基重復(fù)區(qū)時(shí)準(zhǔn)確度不高。Solexa較454具有通量高、片段短、價(jià)位低的特點(diǎn),可以用于大基因組和小基因組的測(cè)序和重測(cè)序。Solexa雙末端測(cè)序(paired-end sequencing)可以為基因組進(jìn)一步拼接提供定位信息,但是隨著反應(yīng)輪數(shù)增加,序列長(zhǎng)度和質(zhì)量均有所下降,而且在閱讀AT區(qū)時(shí)有明顯錯(cuò)誤傾向。SOLiD基于雙堿基編碼系統(tǒng)的糾錯(cuò)能力以及較高的測(cè)序通量,適合轉(zhuǎn)錄本研究以及比較基因組學(xué)特別是SNP檢測(cè)等,但是測(cè)序的片段短限制了該技術(shù)在基因組拼接中的廣泛應(yīng)用。第三代測(cè)序技術(shù)目前正在研發(fā)階段,尚未正式投入使用。
發(fā)布評(píng)論請(qǐng)先 登錄
高通量測(cè)序數(shù)據(jù)分析:RNA-seq 精選資料分享
全基因組測(cè)序的優(yōu)勢(shì) 精選資料分享
研究首次實(shí)現(xiàn)高通量小RNA芯片非標(biāo)記檢測(cè)
高通量測(cè)序常用名詞匯總
高通量測(cè)序技術(shù)及其應(yīng)用

高通量測(cè)序生物信息學(xué)分析

高通量測(cè)序面臨的5大挑戰(zhàn)

評(píng)論