?

泛素連接酶-底物選擇關系的研究進展

2015-04-10 16:15李楊李棟
生物技術通報 2015年1期
關鍵詞:信息學復合體泛素

李楊 李棟

(軍事醫學科學院放射與輻射醫學研究所 北京蛋白質組研究中心 蛋白質組學國家重點實驗室,北京 102206)

泛素連接酶-底物選擇關系的研究進展

李楊 李棟

(軍事醫學科學院放射與輻射醫學研究所 北京蛋白質組研究中心 蛋白質組學國家重點實驗室,北京 102206)

泛素是一種包含76個氨基酸的小分子蛋白。泛素共價結合到底物的過程稱為泛素化修飾。泛素化修飾過程是一個由級聯的泛素激活酶、泛素結合酶和泛素連接酶所介導的復雜過程,泛素化修飾具有高效、ATP依賴、高度特異的特點。泛素化修飾與細胞周期調控、細胞凋亡、轉錄調控、DNA損傷修復等一系列生物學過程密切相關。在泛素化修飾過程中,泛素連接酶對底物的識別,是決定泛素化修飾特異性的關鍵環節。泛素連接酶底物識別的相關機制研究不斷被報道,鑒定泛素連接酶底物的高通量方法也在不斷的改進和發展。隨著實驗研究的不斷深入,實驗數據的不斷產出,利用生物信息學進行泛素連接酶底物的研究也開始受到關注。對泛素連接酶識別底物的相關機制、高通量泛素連接酶底物的鑒定方法、泛素連接酶底物的生物信息學研究和生物信息學在泛素連接酶底物研究中的發展方向進行討論。

泛素化修飾;泛素連接酶;底物;生物信息學

DIO: 10.13560/j.cnki.biotech.bull.1985.2015.01.002

泛素(Ubiquitin)是真核生物中一種由76個氨基酸組成,僅8.5 kD的小分子調節蛋白,于1975年被發現[1]。泛素化是一種蛋白質的翻譯后修飾,是泛素共價結合到蛋白質賴氨酸殘基上或者N末端的過程。泛素化修飾是一個多酶級聯的、消耗ATP的反應。參與泛素化過程的酶包括泛素激活酶(E1,ubiquitin activating enzymes),泛素結合酶(E2,Ubiquitin conjugating enzymes),泛素連接酶(E3,ubiquitin ligases)[2]和去泛素化酶(Deubiquitinating enzyme,DUB)。泛素化修飾最為人們所熟知的功能是利用多聚泛素鏈標記靶蛋白,介導被標記蛋白的蛋白酶體降解[3]。泛素化修飾既能將單個的泛素修飾到底物,發生單泛素化(Monoubiquitination),也可以將利用泛素本身所包含的7個賴氨酸形成的多聚泛素鏈修飾到底物發生多聚泛素化(Polyuniquitination)。除了利用自身所具有的賴氨酸形成多聚泛素鏈,泛素還可以通過肽鍵形成線性的泛素鏈[4]。這些復雜的修飾形式決定了泛素化修飾在多種生物學過程中扮演重要角色。單泛素修飾影響細胞的膜運輸、內吞和病毒出芽等過程[5,6];由48位賴氨酸(K48)形成的泛素鏈發生的修飾,主要介導蛋白質的蛋白酶體降解;由63位賴氨酸(K63)形成的泛素鏈發生的修飾,與內吞作用、炎癥響應、蛋白質翻譯和DNA修復相關。而其他形式的泛素鏈與細胞周期、溶酶體降解、激酶識別等一系列過程相關。

在泛素化修飾過程中,泛素連接酶對底物的選擇過程是泛素化調控特異性的關鍵。泛素連接酶負責將泛素或多聚泛素鏈從E2轉移到底物賴氨酸殘基或者蛋白質N端殘基[7],決定底物蛋白的命運。泛素連接酶依據結構的不同主要分為3類:RING類、HECT類、U-box類。目前已知的E3數目至少超過600種[8,9],多于激酶的數量(518種)。泛素連接酶與眾多的生物學過程密切相關,如Pellino家族E3之前被認為通過促進IRAK1的泛素化調節天然免疫信號通路,最近研究表明,Pellino家族E3通過泛素化參與更多的先天和適應性免疫調節,參與TLR信號通路的調控[10];PRP19[11]、RNF4[12]、RNF8[13]等泛素連接酶參與DNA損傷應答;SCF(FBW7)通過靶向MCL1發生泛素化降解調節細胞凋亡[14];FBXO31介導Cyclin D1的降解,與細胞DNA損傷的G1期阻滯密切相關[15]。泛素化修飾幾乎調控真核細胞功能的所有方面。因此,泛素化修飾與許多疾病有密切關系:泛素連接酶Cbl-b和TAM受體能利用自然殺傷細胞調節癌細胞的轉移[16];FBXO11的失活會導致BCL6的過表達,從而引發彌散性巨型B細胞淋巴癌[17];c-Cbl和Cbl-b對人的骨細胞形成和破壞起重要作用[18]。由于E3對底物識別具有特異性,是非常有潛力的藥靶。E3與多種腫瘤的發生發展密切相關,通過干預E3的功能,可以對多種癌癥起到治療作用。目前,有多個團隊正在研發針對泛素連接酶HDM2,或者干擾HDM2-p53相互作用的抑制劑以穩定p53的表達,進而用于腫瘤治療[19,20]。

E3與底物特異性的選擇機制和調控作用的發現,對揭示泛素化修飾所參與的細胞調控過程,理解泛素化修飾相關疾病的發病機理,研發高特異性、低副作用的藥物具有重要意義?,F在對泛素連接酶底物的研究,主要采用分子生物學方法,通過體內或體外的實驗,尋找特定泛素連接酶底物。目前也建立了一些高通量的泛素連接酶底物鑒定方法,同時生物信息學研究也在泛素連接酶底物的發現中進行了一些嘗試。這些研究為理解泛素連接酶與底物選擇關系,提供了多方面的幫助。本文將從泛素連接酶底物識別機制、鑒定泛素連接酶底物的高通量方法和泛素連接酶底物選擇關系的生物信息學研究3個方面對泛素連接酶和底物選擇關系的研究進展進行綜述。

1 泛素連接酶底物識別機制

由于泛素連接酶數目眾多,并且存在大量復合體泛素連接酶。在泛素連接酶識別底物的過程中,有很多適配體參與其中。并且,泛素化修飾與多種其它翻譯后修飾存在著交互應答,特別是與磷酸化修飾存在多種多樣的相互調控作用。這些原因都導致泛素連接酶對底物的識別機制變得異常復雜。

1.1 通過特定的序列特征識別底物

泛素連接酶對底物的識別,可能是由特定的序列所介導的。這里的序列主要指結構域和motif。結構域(Domain)是指蛋白中具有特定結構的一段序列,結構域通常為60-300個氨基酸長度。Motif(有翻譯為模體)是一些比較短的(通常小于10個氨基酸)、包含一些特定氨基酸的序列段[21]。目前有許多關于E3利用特定的domain或motif識別底物的特定motif或domain的研究報道。

APC/C復合體是一個由多個亞基組成的RING類復合體泛素連接酶,APC/C復合體利用Cdc20和Cdh1亞基作為底物識別亞基,Cdc20和Cdh1利用WD40 domain識別一些特定的motif識別底物。APC/C復合體識別底物的motif包括D-box motif和KEN-box motif。D-box motif又稱為RxxL motif,是指包含RxxL氨基酸的一段序列,其中x表示任意氨基酸。RxxL motif在所有哺乳動物的PLK1同源蛋白中都出現,具有很高的保守性[22]。利用這個motif,APC/C復合體識別PLK1、ID2[23]等蛋白。KEN-box motif可識別多種底物,包括Cdc20,Cdc20上的KEN motif能被由Cdh1形成的APC/C復合體泛素連接酶所識別并泛素化[24]。通過KEN motif被識別的底物,包括與有絲分裂相關的中心體復制因子STIL[25]、與轉錄相關的蛋白TRRAP[26]等。

HECT類泛素連接酶中也存在類似的底物識別機制,最典型的是NEDD4家族,人類的NEDD4家族包括9個成員:NEDD4、NEDD4-2/NED4L、ITCH、SMURF1、SMURF2、WWP1、WWP2、NEDL1及NEDL2[27]。該家族的E3結構上類似,N端包含一個C2 domain,C端為HECT domain,中間段包含2-4個重復的WW domain。該家族能夠通過WW domain識別底物的PY motif[28](包含PPxY序列的氨基酸段,x代表任意氨基酸),實現底物識別,如NEDD4-2能通過WW domain識別上皮細胞鈉離子通道的β和γ亞基的PY motif[29]。

但是蛋白上具有這些motif,并不是該蛋白被E3識別的必要條件。如Axin由SMURF1介導發生K29多聚泛素化,Axin上具有PY motif,但是通過研究發現,SMURF1上的WW結構域對于Axin泛素化不是必須的,Axin并不被SMURF1上的WW domain所識別[30]。進一步研究發現,SMURF1上的C2 domain是泛素化Axin的關鍵結構域。另外,Zhi等[31]在對WWP1進行綜述時也介紹了WWP1既能識別包含PY motif的底物,也能識別不包含PY motif的底物。并且給出了19個包含PY motif的底物和8個非PY motif的底物。在這些例子中,E3可能依賴一些人們所未知的motif對底物進行識別,但是這些現象也說明了泛素連接酶與底物選擇關系的復雜性。

1.2 利用適配體識別底物

所謂適配體(Adaptor)是一些與E3和底物發生相互作用的蛋白,研究發現,E3在調節底物泛素化的過程中,除了直接與底物結合,有時候還有一些適配體參與調節。這些適配體發揮多種多樣的功能。如TGFβ受體是一個復合體,能將信號跨膜傳遞給Smad信號通路。TGFβ能夠被Nedd4家族泛素連接酶SMURF1識別并降解。SMURF1并不是直接連接到TGFβ受體的亞基上,而是利用適配體Smad7結合TGFβ,并介導TGFβ的泛素化降解[32]。

RING類泛素連接酶中也存在類似的適配體,特別是復合體泛素連接酶,其多利用Cullin蛋白作為支架,連接用于識別E2的包含RING結構域的蛋白(如ROC1)和用于底物識別的亞基(70多種F-box蛋白)。這些用于底物識別的亞基,某種意義上也可算作是識別底物的適配體。非復合體的RING類泛素連接酶TRAF6,也能夠利用p62蛋白,結合NGF受體TrkA,并介導TrkA的K63泛素化[33]。

除了作為E3和底物連接的支架,適配體還具有其他的作用,如激活或者抑制E3的活性,調節E3的細胞定位等。適配體所具有的這些豐富的功能,除了決定E3底物識別的特異性,一定程度上還決定了E3調控底物的時空特異性。

1.3 泛素化修飾與其他翻譯后修飾的cross-talk

泛素化修飾與其他翻譯后修飾存在廣泛的crosstalk。目前,研究最多的是泛素化與磷酸化間的crosstalk。磷酸化既可激活泛素化修飾,也可抑制泛素化修飾。如β-catenin和IκB都可被由Cul1、skp1和f-box蛋白β-TRCP組成的復合體E3所識別。但它們在通常狀態下并不被該復合體E3所識別,當IκB的第32位和第36位絲氨酸被磷酸化或當β-catenin的第33位和第37位絲氨酸被磷酸化時,才能被由β-TRCP形成的復合體泛素連接酶所識別[34]。

在ITCH泛素連接酶的活性調控過程中,磷酸化發生了更廣泛的作用。ITCH并非組成型活化的泛素連接酶,前面所述ITCH泛素連接酶屬于NEDD4家族,ITCH會發生內部折疊和自身相互作用,HECT domain會與WW domain發生連接,從而抑制ITCH的泛素連接酶活性。而激酶JNK1可以磷酸化ITCH的199位絲氨酸、222位蘇氨酸和232位絲氨酸,釋放與WW domain結合的HECT domain,激活ITCH的泛素連接酶活性。激活后的ITCH可以促進JunB的泛素化。當該過程需要被減弱或終止時,絡氨酸激酶Fyn能夠磷酸化ITCH的371位絡氨酸,這個位點位于WW domain,磷酸化修飾后ITCH將無法利用WW domain與底物的PY motif結合[35],從而抑制ITCH的活性。

sumo化修飾是一種類泛素化修飾,同樣修飾底物上的賴氨酸位點。在DNA修復過程中,存在著兩種潛在的泛素化與sumo化修飾的cross-talk,第一種是PIAS可能sumo化RNF168和HERC2,HERC2的sumo化造成其內部發生相互作用,使HERC2和RNF8組裝成復合體,這個復合體能夠配合RNF168在DNA損傷的位置附近的蛋白上形成泛素鏈。另一種潛在機制是PIAS介導MDC1的sumo化和DNA損傷位置附近蛋白的sumo化,sumo化的MDC1能夠募集RNF4,連同RNF8形成泛素鏈,并結合在之前修飾在DNA損傷位點附近蛋白上的sumo蛋白,形成sumo-泛素混合鏈[36]。除了與泛素化修飾協同,sumo化修飾還和泛素化修飾存在許多競爭關系。泛素化修飾能夠促進IKBα的蛋白酶體降解,而sumo化修飾能夠與IKBα的泛素化修飾發生競爭,從而維持IKBα的穩定[37]。

作為另外一種重要的類泛素化翻譯后修飾,NEDD8修飾與泛素化修飾之間也存在重要的crosstalk。NEDD8修飾重要的功能之一,就是促進SCF復合體泛素連接酶的活性。但是NEDD8并不影響SCF復合體泛素連接酶的組裝,而是能夠幫助募集E2,從而達到促進泛素化修飾的作用[38]。

甲基化修飾是組蛋白翻譯后修飾中研究最多的一類。某些組蛋白殘基可以通過甲基化抑制或激活基因表達,從而成為表觀遺傳。甲基化修飾的位點通常為精氨酸和賴氨酸。組蛋白同樣可以發生泛素化修飾,組蛋白的甲基化修飾和泛素化修飾之間,也存在著相互影響。如組蛋白H2B的123位賴氨酸能夠發生泛素化修飾,該修飾幫助起始組蛋白H3的79位甲基化修飾。組蛋白H3的79位甲基化修飾需要酶Dot1的輔助,而Dot1促進組蛋白H3的79位甲基化,同時能夠抑制組蛋白H2B的123位泛素化修飾,從而形成反饋調節回路,控制組蛋白H3的甲基化修飾水平[39,40]。

磷酸化、甲基化等和多種類泛素化修飾與泛素化修飾之間的cross-talk,對泛素化修飾產生了幫助E3識別底物、激活或抑制E3活性、促進泛素鏈形成、調控組蛋白甲基化修飾等一系列的調控作用,這些調控存在非常精細的機制,使得泛素化修飾和其他翻譯后修飾的發生不僅具有底物選擇的特異性,更具有了時空的特異性。這些翻譯后修飾借助它們之間的協同或抑制關系,通過功能的組合,發揮更多樣的調控作用。

2 鑒定泛素連接酶底物的高通量方法

泛素的得名是因其在生物體內廣泛的存在。而數目眾多的E3也決定了泛素化修飾在體內是大量發生的。傳統的泛素連接酶底物鑒定試驗方法,多集中于對單個E3和少數底物的選擇關系的實驗研究和驗證,這樣的研究方法雖能比較精確的得到E3和底物的選擇關系,但實驗通量低,難以達到全面研究泛素連接酶和底物選擇關系的目的。近些年來,一些高通量實驗方法可以進行較大規模的泛素連接酶的底物發現。這些方法包括基于蛋白全局穩定性分析(Global protein stability profiling,GPS)、基于蛋白質微陣列和基于質譜技術等的一系列方法。

2.1 基于全局蛋白質穩定性分析方法

蛋白質全局穩定性分析方法,巧妙地將編碼紅色熒光蛋白和綠色熒光蛋白的核酸序列構建在同一個腺病毒載體上,并且在兩個熒光蛋白之間加入核糖體入口,將編碼綠色熒光蛋白的核酸和編碼目標蛋白的核酸構建在一起,利用該腺病毒侵染宿主細胞,就能夠在宿主細胞中等比例的表達紅色熒光蛋白和帶綠色熒光蛋白的靶蛋白,如果靶蛋白被降解,則紅色熒光蛋白和綠色熒光蛋白的比例會發生變化,利用流式細胞技術,可以進行蛋白質穩定性分析[41]。

Hsueh-Chi等[42]利用顯性失活突變技術,替代RNA干擾技術,構建顯性失活的Cul1,Cul1是構成SCF復合體泛素連接酶的支架蛋白,如果Cul1失活,即便底物識別亞基能夠識別并結合底物,也無法將泛素修飾到底物。通過多輪的流式細胞篩選,最后鑒定出因為Cul1失活,而導致蛋白質豐度發生顯著變化的蛋白,作為潛在的底物。利用該方法鑒定到了大于350個潛在的底物,并且鑒定到了大部分已知的底物。利用GSP方法鑒定泛素連接酶底物能夠鑒定穩定性發生變化的底物蛋白。但是造成泛素連接酶底物降解的泛素化修飾主要是K48泛素鏈修飾,K63泛素鏈主要和信號轉導相關。所以針對K63位泛素鏈或者其他非降解的泛素化修飾形式,難以有效使用該方法。

2.2 基于蛋白質微陣列的泛素連接酶底物鑒定

基于蛋白質微陣列的泛素連接酶底物鑒定技術,主要是通過構建體外的泛素化體系,對構建在微陣列上的蛋白質進行泛素化實驗,之后利用多種方法進行檢測和分析。如Andrews等[43]利用蛋白質微陣列鑒定了SMURF1的底物。通過給泛素連接上生物素標簽,泛素分子可以利用streptavidin-Alexa Flour進行熒光檢測,通過熒光判斷是否發生了泛素化。利用該方法,共有89個潛在的SMURF1底物被鑒定。Loch等[44]利用兩塊微陣列板,使用兩種泛素抗體與泛素發生抗原抗體反應。一種既能結合單泛素,又能結合多聚泛素鏈;一種只能結合多聚泛素鏈。通過進一步的GO分析,選取了部分結果作為進行后續實驗的備選底物。

基于蛋白質微陣列方法鑒定泛素連接酶底物,相比GPS方法簡單且高效,并且通過采用合適的泛素鑒定方法,可以不受所修飾泛素鏈形式的影響。但是利用蛋白質微陣列進行泛素連接酶底物鑒定,需要構建體外的泛素化體系,篩選合適的E2,然而根據前面所述,泛素化修飾可能受到其他翻譯后修飾的調控,泛素化的發生也具有一定的時空特異性,這些在體外泛素化修飾實驗中難以模擬。另一方面,利用蛋白質微陣列進行底物鑒定,所能覆蓋的底物規模,受到微陣列本身的限制。所以基于蛋白微陣列進行泛素連接酶底物的鑒定,主要用于為后續更深入的研究進行初步的底物篩選。

2.3 基于噬菌體展示技術的泛素連接酶底物鑒定

噬菌體展示(Phage display)技術是一種高通量的研究蛋白質-蛋白質、蛋白質-肽段、蛋白質-DNA相互作用的方法。噬菌體展示技術的原理是將需要研究的蛋白或多肽的基因與噬菌體表面蛋白的編碼基因融合,經過表達并裝配成噬菌體后,待研究蛋白或多肽會以融合蛋白的形式呈現在噬菌體表面。而導入了多種蛋白的一群噬菌體,就構成了一個噬菌體展示文庫。利用噬菌體展示技術對泛素連接酶底物進行篩查,首先需要進行陰性選擇。將人腦cDNA展示文庫與僅包含E1、E2和His標簽泛素,而不包含E3的體外泛素化系統以及Ni-beads共同孵育。收集沒有與Ni-beads結合的噬菌體,并用它們感染BLT5403大腸桿菌進行擴增,擴增后的文庫用于陽性篩選。在陽性篩選過程中,將之前擴增的文庫與包含E3的體外泛素化系統及Ni-beads共同孵育,Ni-beads會結合His標簽,所以發生泛素化修飾的噬菌體會被Ni-beads所捕獲。將這些噬菌體從Ni-beads上洗脫后,用這些噬菌體感染BLT5403大腸桿菌擴增,再重復進行陰性、陽性篩選,經過多輪篩選后,單克隆的噬菌體利用PCR進行測序,從而得到E3的底物序列[45]。

該技術的原理決定它可以對非降解的泛素連接酶底物進行考察,并且只要能夠構建E3對應的體外泛素化修飾系統,理論上就可以對底物進行篩查。但該技術與利用蛋白質微陣列鑒定泛素連接酶底物的原理類似,所以也存在和利用蛋白微陣列進行泛素連接酶底物鑒定存在類似的限制。

2.4 基于質譜技術的泛素連接酶底物鑒定

基于質譜技術的泛素連接酶底物鑒定包括多種方法,這些方法之間存在較大差異,其共同點是最后都是通過質譜技術進行蛋白質鑒定。Yumimoto等[46]發展了一種利用差異蛋白質組鑒定F-box構成的復合體泛素連接酶底物的方法DiPIUS。這兩種方法首先都需要構建野生型和突變的F-box蛋白,并且給它們帶上FLAG標簽。突變的F-box蛋白不能與skp1結合,也就不能構成完整的SCF泛素連接酶復合體,無法介導底物發生泛素化。第一種方法是將F-box在分別用12C和13C標記的細胞中表達,利用MG132抑制蛋白酶體。然后通過免疫共沉淀技術同時對野生型和突變型F-box蛋白進行沉淀,經過酶切后進行質譜鑒定,進行差異蛋白質組分析。另一種方法,將兩種F-box蛋白分別在不標記的細胞中表達,然后分別用免疫共沉淀技術對F-box蛋白進行沉淀。利用SDS-PAGE蛋白電泳分離蛋白,酶切后分別進行質譜鑒定,進行差異蛋白質組分析。利用該方法,作者對Fbxw7α、Skp2和Fbx15的底物進行了鑒定,得到一些先前已知的底物,如Fbxw7α的底物c-Myc、Skp2底物p27、Fbx15底物IPR1和IPR2,證明了方法的有效性。

另一種利用質譜鑒定底物的方法,是利用串聯的UBA富集泛素的方法進行底物鑒定。UBA結構域是泛素結合結構域,能夠結合泛素。Shi等[47]曾利用4個串聯的UBA拷貝富集泛素化蛋白,并通過質譜技術鑒定泛素化修飾位點。Rubel等[48]進一步利用4個串聯的UBA domain進行泛素化蛋白的富集,首先分離新生大鼠心肌細胞,作為用于后續泛素化試驗的細胞系。將大鼠的MuRF1泛素連接酶包裝成帶Myc標簽的腺病毒,然后侵染之前分離的細胞系,分別向對照組和試驗組加入串聯了4個UBA拷貝的瓊脂糖珠(TUBE組)和不帶UBA結構域的瓊脂糖珠(Control組)。孵育一段時間后進行分離,從瓊脂糖珠上分離蛋白(eluate),并保留上清液(Supernatant),分別做3組2維凝膠電泳:Control TUBE eluate VS Experiment TUBE eluate;Experiment TUBE supernatant VS Experiment agrose control supernatant;Control TUBE supernatant VS Control agarose control supernatant。如果鑒定E3的底物,第1組選取Ctrleluate<Expeluate,第2組選取Expctrl>ExpTUBE,第3組選取Ctrlctrl>CtrlTUBE的蛋白進行質譜鑒定。鑒定后前兩組得到的是發生泛素化的蛋白,第3組得到的是組成型泛素化的底物。通過去冗余分析,可以得到待研究泛素連接酶的底物。如果利用該方法進行DUB底物鑒定,只需要在對凝膠電泳后的結果進行蛋白選取時遵循相反的原則即可。

質譜方法進行泛素連接酶底物的鑒定,分離和獲得潛在底物蛋白的方法多種多樣,最后都需要通過質譜技術對底物蛋白進行鑒定。所以利用質譜技術鑒定底物蛋白,鑒定的覆蓋率和準確性受到質譜技術本身的影響和制約。

2.5 基于NEDD8修飾鑒定泛素連接酶底物

在之前討論泛素化修飾與其他翻譯后修飾的交互中,介紹過NEDD8修飾是一種類泛素化修飾,可將類泛素分子NEDD8修飾到底物的賴氨酸殘基上。利用這一性質,Zhuang等[49]開發了一種鑒定泛素連接酶底物的方法。直接鑒定泛素連接酶的底物有一些困難,如泛素化底物通常較多,所以如果要直接鑒定某一種泛素連接酶的底物,可能受到其他泛素化修飾的干擾。而NEDD8修飾相比泛素化修飾,是一種細胞內比較稀少的修飾,為了鑒定IAP泛素連接酶的底物,Zhuang等巧妙的將NEDD8的結合酶Ubc12與IAP泛素連接酶進行了融合。融合后的蛋白可以將NEDD8修飾到原本應該修飾泛素的底物賴氨酸。通過鑒定被NEDD8修飾的蛋白,就可以鑒定到泛素連接酶的底物。利用該方法,有50多個IAP泛素連接酶的底物被鑒定。

該方法設計非常巧妙,并且利用NEDD8修飾代替泛素化修飾,避免了泛素化修飾底物鑒定中的一些困難。但是泛素蛋白和NEDD8蛋白的空間結構存在著一些差異,可能導致該方法存在一定的假陽性和假陰性問題。

3 泛素連接酶底物選擇關系的生物信息學研究

隨著泛素連接酶與底物選擇關系研究的不斷深入,以及高通量鑒定泛素連接酶底物方法的不斷產生和發展,大量的泛素連接酶和底物選擇關系的研究數據不斷產出。隨之也產生了幾個對泛素連接酶和底物關系進行收錄的數據庫。另一方面,隨著數據的不斷積累,利用生物信息學方法進行泛素連接酶底物的研究和預測變得可能。

3.1 收錄泛素連接酶和底物選擇關系的數據庫

E3net(http://pnet.kaist.ac.kr/e3net/)是一個以E3為中心,收錄泛素連接酶及其底物的數據庫[50],E3net收錄了來自人、小鼠、酵母等多個物種的2 201個E3和4 896個底物數據。以人為例,收錄了415個E3和1 590個底物數據,其中190個E3包含有對應的底物信息。E3net的數據由對PubMed數據庫的文獻摘要的文本挖掘、對UniProt數據庫注釋信息的文本挖掘、對公共泛素化數據庫的整合和少量對高通量實驗數據的整合構成。E3net通過以E3或底物為中心瀏覽數據條目,提供了E3或底物的UniProt訪問號、描述該蛋白為E3或底物的文獻語句或UniProt注釋、通路信息、參與的生物學過程、功能、家族、定位、相關疾病等信息。如果該蛋白有對應的底物或E3信息,則會提供描述它們之間特異性選擇關系的文獻和數據庫信息。為了更全面的了解E3對底物的調控信息,E3net還利用數據庫中的數據構建了一個E3和底物的調控網絡。用戶可以可視化的對該網絡進行瀏覽。

E3net數據庫是目前收錄E3和底物選擇關系最全面的數據庫,其數據具有多個來源,數據質量較高。E3net中收錄了許多復合體的E3,數據庫對這些復合體的亞基進行了系統收錄并且特別標示了復合體中負責底物識別的亞基。利用其構建的網絡可以方便的對E3和底物的相互選擇關系進行瀏覽,幫助進行E3底物調控網絡的研究。但是數據庫的數據自2012年之后沒有更新,也沒有提供數據提交功能,不利于用戶幫助補充數據,并且不提供數據的下載。

hUbiquitome(http://202.38.126.151/hmdd/hubi)數據庫是一個旨在收錄高可信實驗驗證的人類泛素化酶和底物數據的數據庫[51]。數據庫由于對數據的要求標準比較嚴格,所有數據經過人工校驗,所以數據量相對較小。包含1個E1、12個E2、138個E3、279個底物和17個DUB數據。hUbiquitome所有數據基于PubMed數據庫中的文獻獲得。hUbiquitome支持通過blast方式,利用序列信息搜索相關的泛素化酶與底物數據。hUbiquitome提供了全部數據的下載,這相比前面介紹的E3net數據庫,極大地方便了研究者利用hUbiquitome數據庫數據進行更深入的泛素化機制討論。hUbiquitome數據庫提供了用戶提交數據的功能。讓用戶可以參與進行數據庫的完善和補充。但是用戶無法在線提交數據,需要通過填寫表格后郵件發送給作者的方式提交數據,這在一定程度上會影響用戶提交數據的積極性。hUbiquitome數據庫數據自2011年10月后無更新。

SCUD(http://scud.kaist.ac.kr/)數據庫是一個收錄酵母的泛素化相關酶與底物的數據庫[52]。數據庫包含42個不同的E3和940個底物,并對E3進行了分類,但是該數據庫物種比較局限。除了上面介紹的這些數據庫外,泛素化相關的數據庫還有收錄實驗產出的底物和位點信息的Ubiprot數據庫[53]、收錄植物泛素化酶系統的plantsUPS[54]、收錄植物泛素化相關通路的數據庫plantsUBQ等。

3.2 利用生物信息學方法進行泛素連接酶底物的研究和預測

TRAF6是一個RING類E3,p62可以作為泛素連接酶TRAF6的適配體蛋白,幫助識別并結合底物。Jadhav等[55]通過對TRAF6/p62已知的兩個底物NRIF和TrKA進行分析,總結出了一個包含10個氨基酸的motif:[-hydrophobic-k-hydrophobic-x-xhydrophobic-polar1-hydrophobic-polar2-hydrophobic-]進行底物的預測。該研究收集了155個p62的相互作用蛋白和54個不發生相互作用的蛋白,利用bruteforce比對算法,對這些蛋白上K附近的氨基酸進行motif匹配。根據匹配結果,發現了一些可能以p62作為橋接蛋白的TRAF6底物。Jadhav等[55]的研究是較早利用生物信息學進行E3底物研究的工作,具有一定的開創性。

Liu等[56]建立了一種利用KEN-box和D-box motif預測APC/C復合體E3底物的方法。通過考察文獻,共有68個APC/C底物中的74個D-box motif數據和42個APC/C底物中的44個KEN-box motif數據被收集作為金標準數據集。作者定義滿足這兩個motif的序列,以及上下游的m,n個氨基酸組成一個ARM(m,n),采用了之前發展的GPS方法[57,58],通過訓練窗口大?。催x取合適的m值和n值)、位點權重和對打分矩陣進行點突變,建立預測模型。利用這個模型,可考察包含KEN-box和D-box的蛋白是否是APC/C復合物的底物,以及匹配這兩個motif的區域是否是APC/C的識別區域。

但是利用這兩種生物信息學方法進行泛素連接酶底物的預測都是借助E3識別底物的motif進行的,然而目前對泛素連接酶識別底物的motif研究還比較少,所以前面介紹的兩項工作都只針對單個泛素連接酶的底物進行討論。

4 泛素連接酶底物選擇關系研究展望

泛素化修飾作為一種重要的翻譯后修飾,參與了大部分生物學過程。泛素化修飾具有多樣的修飾形式,可以發揮多種多樣的功能。隨著泛素化相關研究的不斷發展,泛素連接酶底物高通量鑒定技術的不斷推進,對泛素連接酶底物的研究將更加的深入,實驗方法將更加的高效和可靠,隨之,將會有大量的泛素連接酶與底物選擇關系數據持續產出。隨著這些數據的積累,生物信息學方法有望在泛素連接酶底物選擇關系包括泛素連接酶底物生物信息學預測、泛素連接酶底物數據庫構建和大規模發現泛素連接酶底物方面發揮重要作用。

4.1 泛素連接酶底物的生物信息學預測

生物信息學在蛋白質相互作用預測領域取得了很好的效果,并且隨著時間的推進不斷的有高水平文獻產出[59-62]。隨著蛋白質相互作用研究的不斷深入,蛋白質相互作用預測不斷加入新的特征,效果不斷提高。而泛素連接酶與底物的選擇關系本質上是一種特殊的蛋白質相互作用。所以通過借鑒蛋白質相互作用預測的方法,結合泛素化修飾具有的性質和生物學特征,對泛素連接酶底物進行生物信息學預測,是很有潛力的研究方向。生物信息學預測泛素連接酶底物,相比實驗方法,花費少,效率高。甚至可以利用生物信息學對全基因組進行掃描,構建基于生物信息學預測的泛素連接酶底物選擇網絡,這將對深入認識泛素連接酶底物選擇機制和輔助實驗人員篩選泛素連接酶底物研究對象提供很大的幫助。

4.2 泛素連接酶底物選擇關系數據庫的構建

雖然目前已建立了E3net、hUbiquitome等收錄泛素連接酶底物選擇關系的數據庫,但收錄的數據或來自對文獻進行的文本挖掘,或來自人工對文獻的閱讀和整理,這些數據庫往往存在數據量較小、數據庫維護較差、數據更新不及時的問題。而泛素連接酶底物數據不斷產出,大量數據未被很好地收錄。所以構建一個數據規模較大,更新及時的泛素連接酶底物數據庫非常必要。并且可以借鑒相互作用數據庫,為實驗人員提供數據提交平臺,讓實驗人員在使用數據庫數據的同時參與到數據庫的數據補充中來。另外可以借鑒STRING數據庫的構建方式[63],將預測得到的數據加入數據庫,以幫助實驗人員進行實驗設計,并且可以通過實驗人員驗證預測數據。

4.3 大規模發現泛素連接酶底物

大規模泛素連接酶底物的發現需要進行大量的實驗工作??梢岳蒙镄畔W輔助實驗驗證,降低實驗規模。隨著生物信息學預測泛素連接酶底物技術的不斷發展,如果能夠取得接近高通量實驗的準確性和覆蓋度,那么利用生物信息學預測,進行底物的初步篩選,可以減少實驗研究的工作量,降低實驗成本?;蛘呖梢岳蒙镄畔W方法,采取一定的策略,進行合理的實驗設計,如借鑒酵母雙雜交實驗中用到的smart pooling[64]方法,借助生物信息學設計合理的實驗分組方案,在降低實驗次數的同時,保證一定的實驗重復,提高實驗的準確性。

[1] Goldstein G, Scheid M, Hammerling U, et al. Isolation of a polypeptide that has lymphocyte-differentiating properties and is probably represented universally in living cells[J]. Proceedings of the National Academy of Sciences, 1975, 72(1):11-15.

[2] Pickart CM, Eddins MJ. Ubiquitin:structures, functions, mechanisms[J]. Biochimica et Biophysica Acta(BBA)-Molecular Cell Research, 2004, 1695(1-3):55-72.

[3] Komander D, Rape M. The ubiquitin code[J]. Annual Review of Biochemistry, 2012, 81:203-229.

[4] Komander D. The emerging complexity of protein ubiquitination[J]. Biochemical Society Transactions, 2009, 37(Pt 5):937-953.

[5] Miranda M, Sorkin A. Regulation of receptors and transporters by ubiquitination:new insights into surprisingly similar mechanisms[J]. Molecular Interventions, 2007, 7(3):157-167.

[6] Ikeda F, Dikic I. Atypical ubiquitin chains:new molecular signals[J]. EMBO Reports, 2008, 9(6):536-542.

[7] Ciechanover A, Ben-Saadon R. N-terminal ubiquitination:more protein substrates join in[J]. Trends in Cell Biol, 2004, 14:103-106.

[8] Deshaies RJ, Joazeiro CAP. RING domain E3 ubiquitin ligases[J]. Annual Review of Biochemistry, 2009, 78:399-434.

[9] Michelle C, Vourc’h P, Mignon L, et al. What was the set of ubiquitin and ubiquitin-like conjugating enzymes in the eukaryote common ancestor?[J]. J Mol Evol, 2009, 68(6):616-628.

[10] Moynagh PN. The roles of Pellino E3 ubiquitin ligases in immunity[J]. Nature Reviews Immunology, 2014, 14(2):122-131.

[11] Wrighton KH. DNA damage response:a ligase makes sense of DNA damage[J]. Nature Reviews Molecular Cell Biology, 2014,15(2):76-77.

[12] Guo X, Baillo A, Dutta SM, et al. HTLV-1 Tax binds to and stabilizes the SUMO-targeted ubiquitin ligase RNF4 during DNA damage response[J]. Retrovirology, 2014, 11(Suppl 1):98.

[13] Zhang S, Zhou Y, Sarkeshik A, et al. Identification of RNF8 as a ubiquitin ligase involved in targeting the p12 subunit of DNA polymerase δ for degradation in response to DNA damage[J]. Journal of Biological Chemistry, 2014, 288(5):2941-2950.

[14] Inuzuka H, Shaik S, Onoyama I, et al. SCFFBW7 regulates cellular apoptosis by targeting MCL1 for ubiquitylation and destruction[J]. Nature, 2011, 471(7336):104-109.

[15] Santra MK, Wajapeyee N, Green MR. F-box protein FBXO31 mediates cyclin D1 degradation to induce G1 arrest after DNA damage[J]. Nature, 2009, 459(7247):722-725.

[16] Paolino M, Choidas A, Wallner S, et al. The E3 ligase Cbl-b and TAM receptors regulate cancer metastasis via natural killer cells[J]. Nature, 2014, 507(7493):508-512.

[17] Duan S, Cermak L, Pagan JK, et al. FBXO11 targets BCL6 for degradation and is inactivated in diffuse large B-cell lymphomas[J]. Nature, 2012, 481(7379):90-93.

[18] Severe N, Dieudonné FX, Marie PJ. E3 ubiquitin ligase-mediated regulation of bone formation and tumorigenesis[J]. Cell Death & Disease, 2013, 4(1):e463.

[19] Berkers CR, Ovaa H. Drug discovery and assay development in the ubiquitinproteasome system[J]. Biochemical Society Transactions, 2010, 38(1):14.

[20] Yang Y, Ludwig RL, Jensen JP, et al. Small molecule inhibitors of HDM2 ubiquitin ligase activity stabilize and activate p53in cells[J]. Cancer Cell, 2005, 7(6):547-559.

[21] Obenauer JC, Cantley LC, Yaffe MB. Scansite 2.0:proteomewide prediction of cell signaling interactions using short sequence motifs[J]. Nucleic Acids Res, 2003, 31(13):3635-3641.

[22] Lindon C, Pines J. Ordered proteolysis in anaphase inactivates Plk1 to contribute to proper mitotic exit in human cells[J]. The Journal of Cell Biology, 2004, 164(2):233-241.

[23] Lasorella A, Stegmüller J, Guardavaccaro D, et al. Degradation of Id2 by the anaphase-promoting complex couples cell cycle exit and axonal growth[J]. Nature, 2006, 442(7101):471-474.

[24] Pfleger CM, Kirschner MW. The KEN box:an APC recognition signal distinct from the D box targeted by Cdh1[J]. Genes & Development, 2000, 14(6):655-665.

[25] Arquint C, Nigg EA. STIL Microcephaly mutations interfere with APC/C-mediated degradation and cause centriole amplification[J]. Current Biology, 2014, 24(4):351-360.

[26] Ichim G, Mola M, Finkbeiner MG, et al. The histone acetyltransferase component TRRAP is targeted for destruction during the cell cycle[J]. Oncogene, 2014, 33(2):181-192.

[27] Ingham RJ, Gish G, Pawson T. The Nedd4 family of E3 ubiquitin ligases:functional diversity within a common modular architecture[J]. Oncogene, 2004, 23(11):1972-1984.

[28] Rotin D, Kumar S. Physiological functions of the HECT family of ubiquitin ligases[J]. Nature Reviews Molecular Cell Biology,2009, 10(6):398-409.

[29] Graham L, Padmanabhan S. NEDD4L in essential hypertension[J]. Journal of Hypertension, 2014, 32(2):230-232.

[30] Fei C, He X, Xie S, et al. Smurf1-mediated axin ubiquitination requires Smurf1 C2 domain and is cell-cycle dependent[J]. Journal of Biological Chemistry, 2014, 289(20):14170-14177.

[31] Zhi X, Chen C. WWP1:a versatile ubiquitin E3 ligase in signaling and diseases[J]. Cell Mol Life Sci, 2012, 69(9):1425-1434.

[32] Kavsak P, Rasmussen RK, Causing CG, et al. Smad7 binds to Smurf2 to form an E3 ubiquitin ligase that targets the TGFβ receptor for degradation[J]. Molecular Cell, 2000, 6(6):1365-1375.

[33] Geetha T, Jiang J, Wooten MW. Lysine 63 polyubiquitination of the nerve growth factor receptor TrkA directs internalization and signaling[J]. Molecular Cell, 2005, 20(2):301-312.

[34] Laney JD, Hochstrasser M. Substrate targeting in the ubiquitin system[J]. Cell, 1999, 97(4):427-430.

[35] An H, Krist DT, Statsyuk AV. Crosstalk between kinases and Nedd4 family ubiquitin ligases[J]. Molecular Biosystems, 2014,10(7):1643-1657.

[36] Zhao Y, Brickner JR, Majid MC, et al. Crosstalk between ubiquitin and other post-translational modifications on chromatin during double-strand break repair[J]. Trends in Cell Biology, 2014, 24(7):426-434.

[37] Gill G. SUMO and ubiquitin in the nucleus:different functions,similar mechanisms?[J]. Genes & Development, 2004, 18(17):2046-2059.

[38] Kawakami T, Chiba T, Suzuki T, et al. NEDD8 recruits E2-ubiquitin to SCF E3 ligase[J]. The EMBO Journal, 2001, 20(15):4003-4012.

[39] Darwanto A, Curtis MP, Schrag M, et al. A modified “cross-talk”between histone H2B Lys-120 ubiquitination and H3 Lys-79 methylation[J]. J Biol Chem, 2010, 285(28):21868-21876.

[40] Lee JS, Shukla A, Schneider J, et al. Histone crosstalk between H2B monoubiquitination and H3 methylation mediated by COMPASS[J]. Cell, 2007, 131(6):1084-1096.

[41] Yen HCS, Xu Q, Chou DM, et al. Global protein stability profiling in mammalian cells[J]. Science, 2008, 322(5903):918-923.

[42] Yen HCS, Elledge SJ. Identification of SCF ubiquitin ligase substrates by global protein stability profiling[J]. Science, 2008,322(5903):923-929.

[43] Andrews PS, Schneider S, Yang E, et al. Identification of substrates of SMURF1 ubiquitin ligase activity utilizing protein microarrays[J]. Assay and Drug Development Technologies,2010, 8(4):471-487.

[44] Loch CM, Eddins MJ, Strickler JE. Protein microarrays for the identification of praja1 e3 ubiquitin ligase substrates[J]. Cell Biochemistry and Biophysics, 2011, 60(1-2):127-135.

[45] Guo Z, Wang X, Li H, et al. Screening E3 substrates using a live phage display library[J]. PloS One, 2013, 8(10):e76622.

[46] Yumimoto K, Matsumoto M, Oyamada K, et al. Comprehensive identification of substrates for F-box proteins by differential proteomics analysis[J]. Journal of Proteome Research, 2012, 11(6):3175-3185.

[47] Shi Y, Chan DW, Jung SY, et al. A data set of human endogenous protein ubiquitination sites[J]. Molecular & Cellular Proteomics,2011, 10(5):M110. 002089.

[48] Rubel CE, Schisler JC, Hamlett ED, et al. Diggin' on U(biquitin):a novel method for the identification of physiological E3 ubiquitin ligase sustrates[J]. Cell Biochemistry and Biophysics, 2013, 67(1):127-138.

[49] Zhuang M, Guan S, Wang H, et al. Substrates of IAP ubiquitin ligases identified with a designed orthogonal E3 ligase, the NEDDylator[J]. Molecular Cell, 2013, 49(2):273-282.

[50] Han Y, Lee H, Park JC, et al. E3Net:a system for exploring E3-mediated regulatory networks of cellular functions[J]. Molecular & Cellular Proteomics, 2012, 11(4):0111.

[51] Du Y, Xu N, Lu M, et al. hUbiquitome:a database of experimentally verified ubiquitination cascades in humans[J]. Database, 2011, 2011:bar055.

[52] Lee WC, Lee M, Jung JW, et al. SCUD:Saccharomyces cerevisiae ubiquitination database[J]. BMC Genomics, 2008, 9(1):440.

[53] Chernorudskiy AL, Garcia A, Eremin EV, et al. UbiProt:a database of ubiquitylated proteins[J]. BMC Bioinformatics,2007, 8(1):126.

[54] Du Z, Zhou X, Li L, et al. PlantsUPS:a database of plants’Ubiquitin Proteasome System[J]. BMC Genomics, 2009, 10(1):227.

[55] Jadhav TS, Wooten MW, Wooten MC. Mining the TRAF6/p62 interactome for a selective ubiquitination motif[J]. BMC Proc,2011, 5(suppl 2):S4.

[56] Liu ZX, Yuan F, Ren J, et al. GPS-ARM:computational analysis of the APC/C recognition motif by predicting D-boxes and KEN-boxes[J]. PloS One, 2012, 7(3):e34370.

[57] Xue Y, Zhou F, Zhu M, et al. GPS:a comprehensive www server for phosphorylation sites prediction[J]. Nucleic Acids Research,2005, 33(suppl 2):W184-W187.

[58] Xue Y, Ren J, Gao X, et al. GPS 2.0, a tool to predict kinasespecific phosphorylation sites in hierarchy[J]. Molecular & Cellular Proteomics, 2008, 7(9):1598-1608.

[59] Jansen R, Yu H, Greenbaum D, et al. A Bayesian networks approach for predicting protein-protein interactions from genomic data[J]. Science, 2003, 302(5644):449-453.

[60] Rhodes DR, Tomlins SA, Varambally S, et al. Probabilistic model of the human protein-protein interaction network[J]. Nature Biotechnology, 2005, 23(8):951-959.

[61] Li D, Liu W, Liu Z, et al. PRINCESS, a protein interaction confidence evaluation system with multiple data sources[J]. Molecular & Cellular Proteomics, 2008, 7(6):1043-1052.

[62] Zhang Q C, Petrey D, Deng L, et al. Structure-based prediction of protein-protein interactions on a genome-wide scale[J]. Nature,2012, 490(7421):556-560.

[63] Snel B, Lehmann G, Bork P, et al. STRING:a web-server to retrieve and display the repeatedly occurring neighbourhood of a gene[J]. Nucleic Acids Research, 2000, 28(18):3442-3444.

[64] Thierry-Mieg N. A new pooling strategy for high-throughput screening:the Shifted Transversal Design[J]. BMC Bioinformatics, 2006, 7(1):28.

(責任編輯 狄艷紅)

Research Advances in the Selective Relationship Between Ubiquitin Ligases and Substrates

Li Yang Li Dong
(State Key Laboratory of Proteomics,Beijing Proteome Research Center,Beijing Institute of Radiation Medicine,Beijing 102206)

Ubiquitin is a small-molecule protein composed of 76 amino acids. The covalent-bonding process between ubiquitin and substrates is defined as Ubiquitination. Ubiquitination modification, an efficient, ATP-dependent, and highly specific process, is mediated by a cascade regulation of ubiquitin activating enzymes, ubiquitin conjugating enzymes, ubiquitin ligase and deubiquitinating enzymes. Ubiquitination is highly relevant with biological processes like cell cycle regulation, cell apoptosis, transcription regulation, DNA damage response and so on. In the process of ubiquitination, the recognition between ubiquitin ligases and substrates is critical for the specificity. The mechanisms of such recognition are being reported moreover the high throughput methods identifying E3’s substrate are being improved and developed. With the accumulation of ubiquitination data from the deep-going research, the bioinformatics approach studying the selective relationship between E3s and substrates is becoming a hot spot. This article will discuss the recognition mechanism between E3s and substrates, the high throughput methods used for the identification of E3’s substrates, review the bioinformatics study about E3s’ substrates and highlight the future research direction.

ubiquitination;ubiquitin-ligase;substrate;bioinformatics

2014-06-09

國家重大科學研究計劃項目(2012CB910300, 2011CB910202),國家高技術研究發展計劃項目(“863”計劃)(2012AA020201),國家自然科學基金項目(31271407),國際科技合作與交流專項(2014DFB30020)

李楊,碩士研究生,研究方向:泛素連接酶底物的生物信息學;E-mail:liyang_bprc@163.com

李棟,博士,副研究員,研究方向:蛋白質組學和生物信息學;E-mail:lidong.bprc@foxmail.com

猜你喜歡
信息學復合體泛素
雞NRF1基因啟動子區生物信息學分析
初論博物館信息學的形成
蛋白泛素化和類泛素化修飾在植物開花時間調控中的作用
CoFe2O4/空心微球復合體的制備與吸波性能
泛RNA:miRNA是RNA的“泛素”
miRNA-148a在膀胱癌組織中的表達及生物信息學分析
泛素結合結構域與泛素化信號的識別
SCF E3泛素化連接酶的研究進展
2014年信息學與計算國際會議
3種多糖復合體外抗腫瘤協同增效作用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合