?

鼠傷寒沙門菌PipD蛋白結構及抗原表位的生物信息學分析

2024-03-26 14:28宋曉蕊劉玉春丁聰賈蕊李瑞靜馬嘉悅李利鋒
醫學信息 2024年4期

宋曉蕊 劉玉春 丁聰 賈蕊 李瑞靜 馬嘉悅 李利鋒

摘要:目的? 用生物信息學方法預測分析沙門菌PipD蛋白的結構和抗原表位,為沙門菌相關疾病的診療和疫苗的研發提供理論依據。方法? 通過NCBI數據庫獲得沙門菌典型致病血清型:鼠傷寒沙門菌(Salmonella typhimurium)ATCC 14028S標準菌株STM14_1240基因的核苷酸序列及其編碼蛋白PipD 的氨基酸序列,運用ProtParam、ProtScale、SignalP 4.1 Server、TMHMM Serverv.2.0、Netphos 3.1 Server、NetNGlyc-1.0、NCBI BLAST、SOMPA、SWISSMODEL、ABCpred、SYFPEITHI和UniProt等生物信息學工具分別對鼠傷寒沙門菌PipD蛋白的理化性質、親疏水特性、信號肽、跨膜區、磷酸化位點、糖基化位點、結構域、二級結構、三級結構、B細胞抗原表位、T細胞抗原表位及蛋白同源性進行預測分析。結果? PipD是由520個氨基酸組成的親水蛋白,分子式為C2608H3963N721O780S16,理論相對分子質量為58.4 kDa,理論等電點為7.34,脂溶指數為67.81,平均親水系數為-0.508。PipD蛋白無信號肽序列,在其35~57氨基酸殘基位置含1個長度為23個氨基酸的跨膜螺旋,屬于跨膜蛋白。預測PipD蛋白含有 57個磷酸化位點和1個糖基化位點。PipD蛋白二級結構以無規則卷曲居多,占36.35%,其次為α螺旋、β折疊、β轉角分別占15.77%、3.27%、44.62%。預測PipD蛋白可形成22個B細胞優勢抗原表位,17個CTL細胞優勢表位和30個Th細胞優勢表位。PipD蛋白與人類基因BCLA3、SCRN2和MRPL4的編碼蛋白同源性分別為29%、24.6%和31.8%,同源性較低。結論? PipD蛋白為親水蛋白,熱穩定性好;存在多個B細胞和T細胞抗原表位,與人類宿主蛋白同源性低,不易發生交叉免疫反應,可作為鼠傷寒沙門菌血清學診斷和疫苗候選蛋白。

關鍵詞:鼠傷寒沙門菌;PipD;生物信息;蛋白結構;抗原表位

中圖分類號:S852.6? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?DOI:10.3969/j.issn.1006-1959.2024.04.001

文章編號:1006-1959(2024)04-0001-07

Bioinformatics Analysis of PipD Protein Structure and Epitope of Salmonella Typhimurium PipD

SONG Xiao-rui1,2,LIU Yu-chun1,DING Cong1,JIA Rui1,LI Rui-jing1,MA Jia-yue1,LI Li-feng1

(Henan International Joint Laboratory of Children's Infectious Diseases1,Department of Otorhinolaryngology Head and Neck Surgery2,Children's Hospital Affiliated to Zhengzhou University,Zhengzhou 450000,Henan,China)

Abstract:Objective? To predict and analyze the structure and antigenic epitopes of Salmonella PipD protein by bioinformatics methods, and to provide a theoretical basis for the diagnosis and treatment of Salmonella-related diseases and the development of vaccines.Methods? The nucleotide sequence of Salmonella typhimurium ATCC 14028S standard strain STM14_1240 gene and the amino acid sequence of its encoded protein PipD were obtained by NCBI database. Bioinformatics tools such as ProtParam, ProtScale, SignalP 4.1 Server, TMHMM Serverv.2.0, Netphos 3.1 Server, NetNGlyc-1.0, NCBI BLAST, SOMPA, SWISSMODEL, ABCpred, SYFPEITHI and UniProt were used to predict and analyze the physicochemical properties, hydrophilicity and hydrophobicity, signal peptide, transmembrane region, phosphorylation site, glycosylation site, domain, secondary structure, tertiary structure, B cell epitope, T cell epitope and protein homology of Salmonella typhimurium PipD protein.Results? PipD was a hydrophilic protein composed of 520 amino acids, the molecular formula was C2608H3963N721O780S16, the theoretical relative molecular mass was 58.4 kDa, the theoretical isoelectric point was 7.34, the fat solubility index was 67.81, and the average hydrophilic coefficient was -0.508. PipD protein had no signal peptide sequence, and contained a transmembrane helix with a length of 23 amino acids at its 35-57 amino acid residues, which belonged to transmembrane protein. It was predicted that PipD protein contained 57 phosphorylation sites and 1 glycosylation site. The secondary structure of PipD protein was mostly random coil, accounting for 36.35%, followed by α-helix, β-sheet and β-turn, accounting for 15.77%, 3.27% and 44.62%, respectively. It was predicted that PipD protein could form 22 B cell dominant epitopes, 17 CTL cell dominant epitopes and 30 Th cell dominant epitopes. The homology of PipD protein with human genes BCLA3, SCRN2 and MRPL4 was 29%, 24.6% and 31.8%, respectively.Conclusion? PipD protein is a hydrophilic protein with good thermal stability. There are multiple B cell and T cell epitopes, which have low homology with human host proteins and are not prone to cross-immune reactions. It can be used as a candidate protein for serological diagnosis and vaccine of Salmonella typhimurium.

Key words:Salmonella typhimurium;PipD;Bioinformatics;Protein structure;Antigenic epitope

沙門菌(Salmonella)是一種重要的人畜共患革蘭氏陰性腸道病原菌,主要通過污染的水源和食物傳播,可感染人和豬、牛等多種哺乳動物,在宿主中引起自限性腸胃炎和菌血癥等多種疾病。有關沙門菌感染的報道逐年增多,加重了預防和控制的負擔[1,2]。沙門菌引起系統性疾病的兩個關鍵階段包括侵襲腸上皮細胞和在巨噬細胞內生存復制。沙門菌的致病能力主要依賴于沙門致病島(Salmonella pathogenicity islands,SPI)編碼的毒力基因,SPI-1和SPI-2是沙門菌兩個最重要的致病島[3,4]。由SPI-1編碼的三型分泌系統(type three secretion system,T3SS)-1 是沙門菌入侵腸道上皮細胞所必需的[5,6];由SPI-2編碼的三型分泌系統T3SS-2是沙門菌在巨噬細胞中復制和系統性感染所必需的[7,8]?;谏抽T致病島編碼基因在沙門菌致病性中的重要作用,本研究以沙門菌典型致病血清型:鼠傷寒沙門菌ATCC 14028S菌株為材料,應用多種生物信息學工具對鼠傷寒沙門菌SPI-5[9]上一個與鼠傷寒沙門菌引起的腸道炎癥相關的毒力基因STM14_1240的編碼蛋白PipD[10-12]進行預測分析,進一步明確其結構、抗原表位以及在鼠傷寒沙門菌致病過程中的可能功能,為沙門菌相關疾病的診療和疫苗研發提供理論依。

1資料與方法

1.1 PipD蛋白的基因組信息? 通過NCBI GeneBank數據庫獲取鼠傷寒沙門菌(Salmonella enterica subsp. enterica serovar typhimurium)ATCC14028S標準菌株STM14_1240基因的核苷酸序列及其編碼蛋白PipD 的氨基酸序列。PipD蛋白在GenBank數據庫中的基因序列登錄號為NC_016856.1,蛋白氨基酸序列登錄號為WP_000760228.1。PipD蛋白編碼基因STM14_1240全長1563 bp,位于鼠傷寒沙門菌14028S菌株基因組的3729722~3731284位置,編碼520個氨基酸,GenBank數據庫中PipD蛋白的FASTA格式氨基酸序列如下:

1.2 PipD蛋白的基本理化性質分析? 運用Expasy-ProParam工具分析PipD蛋白的基本理化學性質;使用Expasy-ProScale工具分析PipD蛋白的親疏水特性。

1.3 PipD蛋白的信號肽、跨膜區、磷酸化位點、糖基化位點和保守域分析? 使用SignalP4.1 Server工具預測分析PipD蛋白的信號肽序列;使用TMHMM Serverv.2.0工具預測PipD蛋白的跨膜區;使用Netphos 3.1 Server工具預測PipD蛋白的翻譯后磷酸化修飾位點;使用NetNGlyc -1.0工具預測PipD蛋白的糖基化位點;應用NCBI BLAST軟件預測PipD蛋白的保守域。

1.4 PipD蛋白的結構預測? 使用SOPMA工具分析PipD蛋白的二級結構及組成;使用SWISS MODEL工具對PipD蛋白的三級結構進行分析和建模。

1.5 PipD蛋白的抗原表位預測? 使用ABCpred和SYFPEITHI工具預測PipD蛋白的B細胞和T細胞抗原表位。

1.6 PipD蛋白的同源性分析? 使用UniProt網站分析PipD蛋白的同源性。

2結果

2.1 PipD蛋白的基本理化性質分析? 使用Expasy-ProParam工具對PipD蛋白的基本理化性質進行預測分析,結果顯示PipD蛋白的分子式為C2608H3963N721O780S16,由8088個原子組成,理論相對分子質量為58.4 kDa,理論等電點為7.34。在PipD蛋白的氨基酸組成中,丙氨酸(Ala)、蘇氨酸(Thr)、絲氨酸(Ser)占比較高,分別占9.8%、7.5%和6.5%;其中帶負電荷的氨基酸(天冬氨酸+谷氨酸)和帶正電荷的氨基酸(精氨酸+賴氨酸)數量均為47個。PipD蛋白在哺乳動物網織紅細胞體外實驗中的半衰期為30 h,脂肪族指數為67.81,不穩定指數為43.37,為不穩定蛋白。通過Expasy-ProScale工具對PipD蛋白的親疏水特性進行分析顯示,PipD蛋白總平均親水性為-0.508,氨基酸得分最大值為2.6,最小值為-2.822,屬于具有良好親水性的蛋白,見圖1。

2.2 PipD蛋白的信號肽、跨膜區、磷酸化位點、糖基化位點和保守域分析? 使用SignalP 4.1 Server對PipD蛋白進行分析得到D值為0.192,表明PipD蛋白不含信號肽序列(圖2)。使用TMHMM Serverv.2.0工具預測在PipD蛋白第35~57位氨基酸處含有1個長度為23的跨膜螺旋(圖3)。Netphos 3.1 Server預測PipD蛋白有22個絲氨酸磷酸化位點、22個蘇氨酸磷酸化位點和13個酪氨酸磷酸化位點(圖4)。NetNGlyc-1.0預測PipD蛋白含有1個糖基化位點,位于第101位,概率為63.49%(圖5)。應用NCBI BLAST預測PipD蛋白包含PepD超家族、Ntn-hydrolase超家族結構域,屬于PepD家族蛋白(圖6)。

2.3 PipD蛋白的結構預測? 使用SOPMA工具分析顯示PipD蛋白含α螺旋(Hh)189個,占36.35%;β折疊(Ee)82個,占15.77%;β轉角(Tt)17個,占3.27%;無規則卷曲(Cc)232個,占44.62%(圖7)。運用Expasy-SWISS MODEL工具預測PipD蛋白三級結構并進行同源建模,模型GMQE評分為0.65,QMEAN值為0.68,表明該模型預測效果較好(圖8)。

2.4 PipD蛋白的抗原表位預測? 使用ABCpred軟件預測PipD蛋白中存在22個潛在的B細胞抗原表位(分值>0.8),見表1。使用SYFPEITHI軟件預測PipD蛋白含有17個限制性CTL表位(分值>20)和30個限制性Th表位(分值>20),見表2、表3。

2.5 PipD蛋白的同源性分析? 在 UniProt網站中輸入PipD蛋白的FASTA格式氨基酸序列,物種選擇 Homo sapiens對PipD蛋白的同源性進行分析發現PipD蛋白與人類基因BCLA3、SCRN2和MRPL4編碼的蛋白同源性分別為29%、24.6%和31.8%(圖9),同源性較低,不易發生交叉免疫反應,表明其免疫原性較好,可作為設計疫苗的潛在蛋白。

3討論

沙門菌是威脅人類健康的一個重要公共衛生問題,每年引起約9300萬例感染[13],導致約15萬人死亡[14],其中,鼠傷寒沙門菌是引發感染的最常見血清型[1]。毒力因子是近年來沙門菌研究的熱點問題,探究沙門菌毒力蛋白的功能,提高沙門菌感染相關疾病的防治水平具有重要的公共衛生意義。

沙門菌的致病性與沙門致病島編碼的毒力基因有關[15],STM14_1240(pipD)是鼠傷寒沙門菌SPI-5上一個重要的毒力基因,編碼T3SS-1的效應蛋白PipD,與鼠傷寒沙門菌引起腸道炎癥相關[10]。通過檢測pipD等毒力基因在鼠傷寒沙門菌分離株中的存在情況可評估沙門菌的潛在毒力及其導致持續感染的風險[16,17]。生物信息學分析通?;谏镄畔祿?,通過生物信息學工具對目標基因和蛋白的結構和功能進行預測和分析,為致病機制研究和疫苗研發提供理論依據[18]。

本研究通過NCBI GeneBank數據庫獲取PipD蛋白的氨基酸序列及其編碼基因的核苷酸序列,應用生物信息學工具預測和分析PipD蛋白的結構特性和功能,結果顯示該蛋白理論相對分子質量為58.4 kDa,理論等電點為7.34。在PipD蛋白的氨基酸組成中,脂肪族氨基酸如丙氨酸、蘇氨酸和絲氨酸等所占比例較高,分別為9.8%、7.5%和6.5%,提示該蛋白蛋白熱穩定性較好。PipD蛋白的半衰期為30 h,提示該蛋白作為免疫抗原可在體內發揮穩定持久作用。親疏水性分析顯示PipD蛋白有多個較強的親水區,有利于抗原表位的形成[19]。

生物信息學分析顯示,PipD蛋白不含信號肽,在該蛋白第35~57氨基酸位置含1個長度為23個氨基酸的跨膜螺旋,其跨膜轉運機制還不清楚。PipD蛋白存在多個潛在磷酸化位點,提示PipD蛋白可能受到磷酸化調控,參與細胞信號轉導過程。預測PipD蛋白含有1個糖基化位點,提示該蛋白可作潛在標志物用于鼠傷寒沙門菌感染的診斷。

二級結構分析顯示,PipD蛋白中無規則卷曲所占比例較大,其次為α-螺旋、β-折疊和β-轉角,表明該蛋白具有良好的抗體嵌合性,易形成抗原表位。三級結構分析顯示PipD蛋白的無規則卷曲大多位于蛋白質外層區域,提示PipD蛋白易在空間構象上形成抗原表位,有利于抗原和抗體相結合??乖砦皇强乖肿由夏芘c相應抗體或淋巴細胞的表面受體結合從而激活機體免疫應答反應的特殊化學集團[20]。ABCpred軟件和SYFPEITHI軟件預測顯示PipD蛋白共有22個B細胞優勢表位,17個 CTL細胞優勢表位和30個Th細胞優勢表位,且與人類宿主蛋白同源性較低,不易發生交叉免疫反應,表明該蛋白免疫原性好,可作為潛在的鼠傷寒沙門菌疫苗候選蛋白,也可用于血清學診斷以提高沙門菌感染檢查的靈敏度和特異性。

綜上所述,PipD蛋白為親水性蛋白,含有B、T細胞抗原表位,即具有抗原性。本研究通過多種生物信息學工具對PipD蛋白的理化性質和結構功能進行預測和分析,可為pipD在鼠傷寒沙門菌致病過程中的可能功能提供更為深入的信息,為研發有效的鼠傷寒沙門菌疫苗提供新的靶點,也為研究鼠傷寒沙門菌的致病機理提供理論參考。

參考文獻:

[1]Fierer J.Invasive Non-typhoidal Salmonella (iNTS) Infections[J].Clin Infect Dis,2022,75(4):732-738.

[2]Sun H,Wan Y,Du P,et al.The Epidemiology of Monophasic Salmonella Typhimurium[J].Foodborne Pathog Dis,2020,17(2):87-97.

[3]Dos SA,Ferrari RG,Conte-Junior CA.Virulence Factors in Salmonella Typhimurium: The Sagacity of a Bacterium[J].Curr Microbiol,2019,76(6):762-773.

[4]Hume PJ,Singh V,Davidson AC,et al.Swiss Army Pathogen: The Salmonella Entry Toolkit[J].Front Cell Infect Microbiol,2017,7:348.

[5]Lou L,Zhang P,Piao R,et al.Salmonella Pathogenicity Island 1 (SPI-1) and Its Complex Regulatory Network[J].Front Cell Infect Microbiol,2019,9:270.

[6]Egan F,Barret M,O'Gara F.The SPI-1-like Type III secretion system: more roles than you think[J].Front Plant Sci,2014,5:34.

[7]Cerny O,Holden DW.Salmonella SPI-2 type III secretion system-dependent inhibition of antigen? presentation and T cell function[J].Immunol Lett,2019,215:35-39.

[8]Jennings E,Thurston T,Holden DW.Salmonella SPI-2 Type III Secretion System Effectors: Molecular Mechanisms And Physiological Consequences[J].Cell Host Microbe,2017,22(2):217-231.

[9]呂雪蓮,周薇,劉松艷,等.腸炎沙門氏菌三種主要毒力島基因缺失株的構建及其免疫效力研究[C]//第十屆全國免疫學學術大會匯編.2015.

[10]Hughes LA,Shopland S,Wigley P,et al.Characterisation of Salmonella enterica serotype Typhimurium isolates from wild birds in northern England from 2005-2006[J].BMC Vet Res,2008,4:4.

[11]Chen Z,Bai J,Wang S,et al.Prevalence, Antimicrobial Resistance, Virulence Genes and Genetic Diversity of Salmonella Isolated from Retail Duck Meat in Southern China[J].Microorganisms,2020,8(3):444.

[12]Soubeiga AP,Kpoda DS,Compaoré MKA,et al.Molecular Characterization and the Antimicrobial Resistance Profile of Salmonella spp. Isolated from Ready-to-Eat Foods in Ouagadougou, Burkina Faso[J].International Journal of Microbiology,2022,2022:1-10.

[13]Stanaway JD,Parisi A,Sarkar K,et al.The global burden of non-typhoidal Salmonella invasive disease: a systematic analysis for the Global Burden of Disease Study 2017[J].The Lancet Infectious Diseases,2019,19(12):1312-1324.

[14]Haselbeck AH,Panzner U,Im J,et al.Current perspectives on invasive nontyphoidal Salmonella disease[J].Curr Opin Infect Dis,2017,30(5):498-503.

[15]Azimi T,Zamirnasta M,Sani MA,et al.Molecular Mechanisms of Salmonella Effector Proteins: A Comprehensive Review[J].Infect Drug Resist,2020,13:11-26.

[16]Thung TY,Radu S,Mahyudin NA,et al.Prevalence, Virulence Genes and Antimicrobial Resistance Profiles of Salmonella Serovars from Retail Beef in Selangor, Malaysia[J].Front Microbiol,2017,8:2697.

[17]Ramtahal MA,Somboro AM,Amoako DG,et al.Molecular Epidemiology of Salmonella enterica in Poultry in South Africa Using the Farm-to-Fork Approach[J].International Journal of Microbiology,2022,2022:1-12.

[18]Canzoneri R,Lacunza E,Abba MC.Genomics and bioinformatics as pillars of precision medicine in oncology[J].Medicina (B Aires),2019,79(Spec 6/1):587-592.

[19]Polasa A,Tabari SH,Moradi M.Developing Efficient Transfer Free Energy Calculation Methods for Hydrophobicity Predictions[J].Biophysical Journal,2021,120(3):115a.

[20]El-Manzalawy Y,Dobbs D,Honavar VG.In Silico Prediction of Linear B-Cell Epitopes on Proteins[J].Methods Mol Biol,2017,1484:255-264.

收稿日期:2023-04-06;修回日期:2023-05-10

編輯/成森

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合