文|觀察未來(lái)科技
近日,Nature 公布了 2023 年值得關(guān)注的 7 項(xiàng)技術(shù),分別是:?jiǎn)畏肿拥鞍踪|(zhì)測(cè)序、詹姆斯韋伯太空望遠(yuǎn)鏡、體積電子顯微鏡、CRISPR、高精度放射性碳測(cè)、單細(xì)胞代謝組學(xué),以及體外胚胎模型。5項(xiàng)技術(shù)花落生物醫(yī)學(xué),其中,單分子蛋白質(zhì)測(cè)序更是受到廣泛關(guān)注。
雖然一直以來(lái),都是基因測(cè)序更為人所知,但今天,蛋白質(zhì)測(cè)序越來(lái)越展現(xiàn)其對(duì)認(rèn)識(shí)生物過程的獨(dú)特價(jià)值。不管是基因測(cè)序,還是蛋白質(zhì)測(cè)序,生物測(cè)序都已經(jīng)進(jìn)入快車道,并為藥物研發(fā)和疾病治療帶來(lái)了新的思路。
從基因測(cè)序到蛋白質(zhì)測(cè)序
基因測(cè)序的出現(xiàn)極大地推動(dòng)了生物學(xué)的發(fā)展,徹底改變了生物學(xué)的研究。今天,它已經(jīng)成為分子生物學(xué)研究中最常用的技術(shù)。在許多不同的細(xì)胞環(huán)境中對(duì)DNA和RNA進(jìn)行排序可以發(fā)現(xiàn)關(guān)于遺傳病、生物發(fā)育和細(xì)胞譜系追蹤等的潛在原因。從人類基因組計(jì)劃,到人類基因組單倍型圖計(jì)劃,再到人類癌癥基因組及個(gè)體基因組計(jì)劃,第一代和第二代測(cè)序技術(shù)功不可沒。
而近幾年發(fā)展起來(lái)的第二代基因測(cè)序技術(shù)更使得基因測(cè)序進(jìn)入了高通量、低成本的時(shí)代。目前,基于單分子讀取技術(shù)的第三代基因測(cè)序技術(shù)已經(jīng)出現(xiàn),該技術(shù)測(cè)定基因序列更快,并有望進(jìn)一步降低測(cè)序成本,為人類從基因水平深入理解疾病的發(fā)生、發(fā)展、診斷和治療提供新的手段,并使個(gè)體化精準(zhǔn)醫(yī)療成為現(xiàn)實(shí)。
要知道,相比于基因測(cè)序,蛋白質(zhì)測(cè)序甚至更早出現(xiàn),并具有相同重要的價(jià)值和意義。不管是蛋白質(zhì)測(cè)序,還是基因測(cè)序,都離不開一個(gè)人,那就是弗雷德里克·桑格。1918年8月13日,桑格出生于英國(guó)格洛斯特郡,父親是一名內(nèi)科醫(yī)師,曾作為傳教士在中國(guó)短暫工作,后因健康原因返回英國(guó),母親則是從事棉花加工生意的商人后代。桑格原本打算跟隨父親的步伐邁入醫(yī)學(xué)界,但高中畢業(yè)進(jìn)入劍橋大學(xué)學(xué)習(xí)后,轉(zhuǎn)而對(duì)生物化學(xué)產(chǎn)生了濃厚興趣,決定成為一名科學(xué)家。而當(dāng)時(shí)的劍橋,正好擁有諸多生物化學(xué)先驅(qū)。
1944年,桑格在劍橋取得化學(xué)專業(yè)的博士學(xué)位,留校跟隨正在研究胰島素的生物化學(xué)系新任教授阿爾伯特·查爾斯·奇布諾爾開始了博士后研究,專注于為氨基酸排序的工作。胰島素在人體的糖代謝過程中起到重要作用,如果胰島素分泌不足,就有可能導(dǎo)致糖尿病??茖W(xué)家開始關(guān)注胰島素的生化性質(zhì),不僅僅因?yàn)樗哂嗅t(yī)學(xué)的應(yīng)用前景,還因?yàn)樗钱?dāng)時(shí)僅有的幾種能夠被提純的蛋白質(zhì)。
在桑格涉足胰島素研究之時(shí),世界生物學(xué)界對(duì)于蛋白質(zhì)的認(rèn)知存在較大分歧,一種觀點(diǎn)認(rèn)為,蛋白質(zhì)沒有明確的化學(xué)組成和結(jié)構(gòu);而另一派則堅(jiān)持認(rèn)為蛋白質(zhì)具有結(jié)構(gòu),并且可以通過化學(xué)方法測(cè)定氨基酸的排列順序。
桑格發(fā)現(xiàn)了一種方法,可以截?cái)噙B接氨基酸鏈的“橋”,這使得他可以研究單個(gè)的氨基酸片段,然后他又將這些片段重新組合成氨基酸長(zhǎng)鏈,進(jìn)而推導(dǎo)出完整的胰島素結(jié)構(gòu)。1953年,桑格成功地測(cè)序了胰島素的氨基酸序列,推翻了原本蛋白質(zhì)是無(wú)序高分子的推論,這項(xiàng)研究極大推進(jìn)了生命科學(xué)的發(fā)展,并給桑格帶來(lái)了1958年的諾貝爾化學(xué)獎(jiǎng)。
獲得1958年的諾貝爾化學(xué)獎(jiǎng)之后,來(lái)自世界各地的訪學(xué)和學(xué)術(shù)報(bào)告邀請(qǐng)紛至沓來(lái),不過很快,桑格又投入了基因測(cè)序的研究之中。
蛋白質(zhì)測(cè)序的困局?
如果說基因檢測(cè)方面的技術(shù)進(jìn)步幫助我們快速而全面地了解了人類健康相關(guān)的成千上萬(wàn)個(gè)基因,那么蛋白質(zhì)測(cè)序就以同樣的方式揭開了成千上萬(wàn)種蛋白質(zhì)的奧秘。在癌癥、阿爾茨海默癥、心力衰竭和糖尿病等許多疾病中,細(xì)胞產(chǎn)生的蛋白質(zhì)等物質(zhì)可以充當(dāng)類似于指紋的獨(dú)特的生物標(biāo)志物,更好地檢測(cè)這些生物標(biāo)志物能夠幫助研究人員了解疾病成因,也能為患者提供更早、更準(zhǔn)確的診斷。
蛋白質(zhì)測(cè)序除了可以更好地檢測(cè)疾病的生物標(biāo)志物,還可能提供一種全新的方式研究癌癥等問題。比如,研究人員可以逐個(gè)觀察細(xì)胞,以了解腫瘤如何從一小群相同的細(xì)胞演變成一群遺傳分化的、各具優(yōu)劣勢(shì)的細(xì)胞。這些研究將為開發(fā)治療癌癥的新方法提供思路。
雖然今天基因測(cè)序方法的增長(zhǎng)速度很快,但蛋白質(zhì)的測(cè)序方法,卻在很大程度上落后了。目前的蛋白質(zhì)測(cè)序方法主要分為三類:基于PCR擴(kuò)增的蛋白質(zhì)測(cè)序、Edman降解測(cè)序以及基于質(zhì)譜的蛋白質(zhì)測(cè)序。
基于PCR擴(kuò)增的蛋白質(zhì)測(cè)序是利用細(xì)胞中表達(dá)的DNA或者RNA進(jìn)行基因測(cè)序,然后再按照氨基酸密碼子表轉(zhuǎn)換為蛋白質(zhì)的氨基酸序列,本質(zhì)上屬于基因測(cè)序技術(shù)。Edman降解測(cè)序是較早發(fā)展的蛋白質(zhì)測(cè)序技術(shù),利用化學(xué)方法從蛋白質(zhì)的N端將氨基酸依次降解,再使用高效液相色譜對(duì)氨基酸進(jìn)行鑒定。但是這種方法只能用于鑒定蛋白質(zhì)和多肽的N-末端氨基酸殘基,無(wú)法對(duì)大的蛋白質(zhì)進(jìn)行全序列測(cè)定。此外,Edman降解法也有一定的局限,例如N末端封閉或有化學(xué)修飾的情況下將不能使用Edman降解法對(duì)蛋白質(zhì)序列進(jìn)行分析。目前使用最廣的蛋白質(zhì)測(cè)序方法是質(zhì)譜法,較Edman降解法而言,其優(yōu)點(diǎn)在于,質(zhì)譜法更敏感,可以更快地裂解肽,可以識(shí)別末端封閉或修飾的蛋白質(zhì)。
換言之,盡管蛋白質(zhì)作為中心法則上的最后一環(huán),科學(xué)家們可以在一定程度上通過基因序列推斷對(duì)應(yīng)的蛋白質(zhì)序列,結(jié)合現(xiàn)有的Edman降解或質(zhì)譜等方法獲得部分肽段序列信息,就可以在一定程度上實(shí)現(xiàn)蛋白質(zhì)測(cè)序。但是這些方法在針對(duì)蛋白質(zhì)的翻譯后修飾檢測(cè)、蛋白質(zhì)序列變化監(jiān)測(cè)和低豐度蛋白質(zhì)富集等方面仍然存在局限。這就要求蛋白質(zhì)測(cè)序的發(fā)展方向一定是對(duì)蛋白質(zhì)的從頭測(cè)序,且盡量能夠?qū)崿F(xiàn)單細(xì)胞水平的蛋白質(zhì)輸入。
蛋白質(zhì)測(cè)序路向何方?
為了改善當(dāng)前蛋白質(zhì)測(cè)序的局限,2018 年,德克薩斯大學(xué)奧斯汀分校的生物化學(xué)家 Edward Marcotte 開發(fā)了一種稱為單分子熒光測(cè)序的方法。在此過程中,用不同的熒光標(biāo)記蛋白質(zhì),可以對(duì)單個(gè)樣本中的數(shù)百萬(wàn)個(gè)蛋白分子進(jìn)行測(cè)序?!拔覀兓旧蟿?chuàng)造了一種類似 DNA 測(cè)序的技術(shù)來(lái)研究蛋白質(zhì)(序列)。”
熒光測(cè)序也是最早開發(fā)的高通量單分子蛋白質(zhì)測(cè)序方法之一,它將熒光肽的單分子顯微鏡與Pehr Edman的降解化學(xué)相結(jié)合,使許多單獨(dú)的肽分子能夠在測(cè)序流動(dòng)池中被平行監(jiān)測(cè),因?yàn)樗鼈兊腘端氨基酸以循環(huán)方式被移除。
可以說,熒光測(cè)序是自下而上的蛋白質(zhì)組學(xué)方法的一個(gè)例子,利用已知的蛋白質(zhì)組或基因組序列,確定單個(gè)蛋白水解肽或蛋白質(zhì)片段的部分序列,然后將其與用于蛋白質(zhì)鑒定的參考數(shù)據(jù)庫(kù)相匹配。
人們已經(jīng)證明了不需要對(duì)蛋白質(zhì)上的每個(gè)氨基酸進(jìn)行從頭鑒定,而是鑒定幾個(gè)氨基酸的序列位置就足以從參考蛋白質(zhì)組中鑒定出蛋白質(zhì)。在實(shí)踐中,熒光測(cè)序是一種混合方法,識(shí)別標(biāo)記氨基酸從頭開始的序列位置,然后將這些部分序列與參考數(shù)據(jù)庫(kù)進(jìn)行匹配,以識(shí)別蛋白質(zhì)。
除此之外,其他研究人員還在開發(fā)模擬基于納米孔的 DNA 測(cè)序的技術(shù),根據(jù)多肽通過微小通道時(shí)在電流中引起的變化來(lái)分析多肽。如荷蘭代爾夫特理工大學(xué)的生物物理學(xué)家 Cees Dekker 和他的同事使用由蛋白質(zhì)制成的納米孔,并且能夠區(qū)分通過孔的多肽中的單個(gè)氨基酸;以色列理工學(xué)院生物醫(yī)學(xué)工程師 Amit Meller 的團(tuán)隊(duì)正在研究由硅基材料制成的固態(tài)納米孔裝置,這些裝置可以同時(shí)對(duì)許多單個(gè)蛋白質(zhì)分子進(jìn)行高通量分析。
2022年,美國(guó)Quantum-Si公司Brian D. Reed研究組還提出了一個(gè)單分子蛋白質(zhì)測(cè)序的方法以及集成系統(tǒng)可以對(duì)蛋白質(zhì)組學(xué)進(jìn)行研究。其中,為了實(shí)現(xiàn)單分子蛋白質(zhì)的測(cè)序,研究人你有們使用互補(bǔ)金屬氧化物半導(dǎo)體制造技術(shù)構(gòu)建了具有納秒精度的定制時(shí)域敏感半導(dǎo)體芯片,包含用于單分子檢測(cè)的完整集成組件,其中包括光傳感器、光波導(dǎo)電路和用于生物分子固定化的反應(yīng)室。
目前,雖然單分子蛋白質(zhì)測(cè)序仍然只是概念驗(yàn)證,但商業(yè)化正在快速到來(lái)。2022 年,Quantum-Si 公司成為商業(yè)化首個(gè)下一代單分子蛋白測(cè)序平臺(tái)的公司,它使用熒光標(biāo)記的結(jié)合蛋白來(lái)識(shí)別蛋白質(zhì)末端的特定氨基酸或多肽序列。該公司已宣布計(jì)劃在今年推出第一代儀器。
總的來(lái)說,蛋白質(zhì)測(cè)序?yàn)樯镞^程提供了深刻的見解。然而,想要了解細(xì)胞中蛋白質(zhì)組的復(fù)雜性以及動(dòng)態(tài)變化、在疾病狀態(tài)下的變化,并將這種技術(shù)變成一個(gè)易獲取、低造價(jià)的方法并不容易,即便如此,蛋白質(zhì)測(cè)序依然非常重要性,這也是Nature會(huì)將蛋白質(zhì)測(cè)序認(rèn)為是2023年值得關(guān)注的7項(xiàng)技術(shù)之一的原因。