防治病毒性肺炎中连花清瘟胶囊重要靶点DPP4的生物信息学分析❋

【www.zhangdahai.com--其他范文】

宫沛钰,徐 捷,王一婕

(1.山西中医药大学中药与食品工程学院,山西晋中 030600;
2.山西省中西医结合医院,太原 030001;
3.山西中医药大学实验管理中心,山西晋中 030600)

2019年新型冠状病毒感染自武汉爆发后,迅速蔓延至世界各地,包括日本、新加坡、美国、意大利等地,构成了国际关注的突发公共卫生事件[1]。爆发以来,国内外患病及死亡人数呈指数上升,大多数感染者均会出现发热症状,病情严重者可并发肺炎、多器官功能衰竭,甚至死亡[2,3]。此次病毒性肺炎严重威胁全人类生命健康,但目前为止没有治疗该病毒性肺炎的特效药物,因此开展相应的防治工作至关重要。

新型冠状病毒感染发生后,中药复方制剂——连花清瘟由于其广谱抗病毒抑菌、调节免疫系统、抗炎、止咳等作用受到研究者广泛关注[4-6]。经药理学实验研究,DPP4(Dipeptidyl peptidase 4)是连花清瘟胶囊的靶点蛋白之一[7,8]。DPP4是一种具有独特底物特性的氨肽酶,与细胞膜结合后具有较强的催化活性,能够裂解第2位为丙氨酸或脯氨酸的蛋白质[3]使体内GLP-1(Glucagon-like peptide-1,GLP-1)水平的降低,引起血糖升高,因此,早期研究中DPP4常用于2型糖尿病的治疗[9]。临床发现患有有糖尿病、高血压、其他呼吸道和心血管疾病等基础疾病的患者,一旦感染更容易发展为重症患者[3,10]。其中2型糖尿病患者感染病毒(Severe Acute Respiratory Syndrome Coronavirus 2)后转为重症患者的比率为普通患者的3倍,且多预后较差,这与慢性高血糖带来的慢性炎症密切相关[11]。随着对病毒性肺炎的深入研究,研究者发现患者的病情与DPP4的血糖及调节代谢作用密切相关[12]。因此通过调节DPP4功能可有效缓解病毒性肺炎病情。

此外,研究发现DPP4与呼吸系统疾病有密切联系[13-17],临床中使用格列汀类等DPP4抑制剂后,患者炎症得到缓解,病毒性肺炎的症状进展情况得以控制[18-19]。不断有证据显示DPP4与SARS-CoV-2的宿主受体蛋白ACE2之间在发病机制中存在相关性[20]。在2020年的一项研究中,研究人员对SARS-CoV-2棘突蛋白同源三聚体结构进行了建模,该模型证明SARS-CoV-2的S1糖蛋白与DPP4之间存在一个结合面,表明两者之间存在紧密的相互作用[21]。另有学者认为,SARS-CoV-2的刺突蛋白与人DPP4的相互作用可能是影响病毒侵入力和毒力的重要因素[22]。

连花清瘟胶囊作为病毒性肺炎医学观察期的重点推荐药物,对DPP4等靶点蛋白产生了综合靶向效果。然而,研究认为不同物种、不同变异体的DPP4蛋白构象差异可能造成病毒侵入或药物治疗时产生不同的效果[23]。因此,对DPP4基因、蛋白的结构与功能进行深入研究就显得尤为必要。本研究拟通过生物信息学手段针对DPP4基因与蛋白进行了系统的整理与分析,为DPP4在SARS-CoV-2等病毒侵入宿主细胞和连花清瘟胶囊等药物防治等方面的研究打下基础,以期为相关领域的深入开发提供可靠的思路。

1.1 基因及蛋白序列

DPP4基因及蛋白数据来自美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)蛋白数据库,基因登录号为:BAG70153.1。

1.2 分析方法

1.2.1 DPP4理化性质分析 使用ExPASy系统中的ProtParam软件分析DPP4的分子式、分子量、酸碱性、等电点和稳定性等理化性质;
通过Protscale对DPP4蛋白的亲疏水性做进一步验证;
在SignalP 4.0 Server中分析DPP4信号肽结构;
TMHMM Server v.2.0软件预测DPP4的跨膜区域。

1.2.2 DPP4空间结构预测 使用PSORTⅡ软件研究DPP4蛋白在亚细胞水平的定位情况,通过SOPMA软件分析DPP4蛋白的二级结构,由SWISS-MODEL建模得到DPP4蛋白的三级结构。

1.2.3 DPP4蛋白修饰位点预测 使用NetPhos3.1软件预测DPP4蛋白的磷酸化位点;
其中N-糖基化位点由NetNGlyc 1.0 Sever进行预测;
O-糖基化位点由NetOGlyc 4.0 Server和YinOYang 1.2 Server两个软件共同预测。

1.2.4 DPP4蛋白功能预测 使用STRING软件对DPP4的相关蛋白相互作用关系进行预测并对DPP4参与的各种生物活动进行综合分析。在MEGA X软件中对DPP4蛋白通过算法进行系统进化树的构建。

2.1 DPP4蛋白的基本性质研究结果

DPP4蛋白的分子式为C4007H6017N1025O1179S27,分子量为88278.63,共由20种、766个氨基酸组成,其中丝氨酸(S)共64个,占比最高,为8.4%,半胱氨酸(C)共12个,占比最低,为1.6%(见图1)。

图1 DPP4蛋白的氨基酸组成情况

根据ProtParam软件的分析,DPP4蛋白带负电荷的残基总数(Asp+Glu)为86,带正电荷的残基总数(Arg+Lys)为70,理论等电点为5.67,属于酸性蛋白。ProtParam软件在280 nm处在水中测量蛋白质的消光系数,并以M-1cm-1为单位。当假设所有Cys残基对均形成胱氨酸时,吸光度0.1%(=1 g/L)为2.262,消光系数为199 690;
当假设所有Cys残基都消除时,吸光度0.1%(=1 g/L)为2.254,消光系数为198 940。DPP4蛋白氨基酸序列的N端氨基酸为甲硫氨酸(M),在体外的哺乳动物网织红细胞中的半衰期为30小时。此外,ProtParam软件对DPP4蛋白的不稳定指数(II)计算为43.35,归类为不稳定蛋白,脂肪指数为80.29,亲水性总平均值(GRAVY)为-0.340,为亲水性蛋白。

接着通过Protscale对DPP4蛋白的亲疏水性做出进一步验证,据Protscale软件分析,DPP4蛋白亲疏水性正值得分最高位点位于第24位,为脯氨酸(P)残基,得分为2.989,此处疏水性较强;
负值得分最高点位于第681位,为天冬氨酸(D)残基,得分是-2.522,此处亲水性较强(见图2)。从图中可以看到,DPP4蛋白的氨基酸残基的得分大多为负值,综合考虑Protscale软件和ProtParam软件的分析结果,可以判定DPP4蛋白应为亲水性蛋白。

图2 DPP4蛋白的亲疏水性分析

通过预测信号肽结构有助于分析蛋白质的分布及功能,在SignalP 4.0 Server中将生物群选为真核生物后对DPP4信号肽结构的预测。分析其结果,其中C值为切割位点分数,在切割位点处数值较高,S值得分高低可以表示氨基酸是否为信号肽的一部分,Y值是综合C值与S值的结果,其值能够更好地判断切割位点(见图3)。

图3 DPP4的信号肽预测结果

通过SignalP 4.0 Server对数据的最终分析结果,结果显示没有证据可以表明DPP4蛋白在N端存在信号肽结构,如表1。

表1 DPP4的信号肽预测数据

由于缺少信号肽的导向,进一步分析了DPP4的转运和分泌方式。通过SecretomeP 2.0 server进行分析,DPP4蛋白的NN评分0.719,而该软件建议哺乳动物蛋白氨基酸序列的阈值应为0.6,因此有理由认为DPP4蛋白是一种非经典分泌蛋白。

随后,对DPP4蛋白的跨膜结构进行预测分析,在TMHMM Server v.2.0中提交DPP4的氨基酸序列可知,1位到6位位于膜内,共6个氨基酸残基,7位到29位为跨膜螺旋结构,共23个氨基酸残基,30位到766位位于膜外,共737个氨基酸残基(见图4)。因此,DPP4蛋白共拥有1个跨膜结构域。

图4 DPP4的跨膜结构预测结果

2.2 DPP4基因及蛋白的表达及定位研究结果

对基因及蛋白表达或定位的研究有利于分析疾病发生发展或病原体的侵入行为。因此从NCBI-Gene数据库中得到DPP4基因的转录组测序结果,该结果是对代表27种不同组织的95名人类个体的组织样本进行的RNA-seq分析,该分析方法可以反应多种或某种RNA的表达水平,分析结果可以确定蛋白质编码基因的组织特异性,结果以RPKM(reads per kilobase per million reads placed)表示。分析可知,DPP4在小肠中的表达量最高,其RPKM为69.428±12.497,其次为胎盘(56.296±12.816)、前列腺(55.334±32.766)、十二指肠(52.87±1.368)、肾(48.435±22.184)等,均有较高的表达。DPP4在胰腺中的表达量最低,其RPKM仅为0.369±0.089,另外在骨髓(0.428±0.11)、脑(0.488±0.079)、心(0.807±0.415)、睾丸(0.871±0.276)等组织中的表达也较低(见图5)。

图5 DPP4转录组测序结果

同时,进一步研究DPP4蛋白在亚细胞水平的定位情况,以期为靶向药物的研究提供更详尽的理论参考。PSORTⅡ软件的预测结果认为,DPP4蛋白在内质网中分布最多,占比55.60%,而在线粒体、细胞质、细胞核、高尔基体等亚细胞结构中分布较少,均为11.10%。此外,通过提交的DPP4蛋白的氨基酸序列,PSORTⅡ软件子程序还提供了更多的DPP4蛋白预测信息:根据该软件的PSG信号肽预测结果,支持SignalP 4.0 Server软件所作出的DPP4不含N端信号肽的预测结果;
MTOP膜拓扑结构预测结果显示,DPP4蛋白的N端位于细胞膜内,其拓扑结构为2型。

2.3 DPP4蛋白的多级结构预测结果

确定蛋白质的多级结构是新药研发及蛋白生理活性研究的重要基础,在此,确定DPP4蛋白的二级结构、保守结构域及三级结构。通过SOPMA软件分析DPP4蛋白的二级结构(见图6)。图中蓝色线条或字母代表α螺旋,共139个氨基酸残基占比18.15%;
红色线条或字母代表延伸链,共227个氨基酸残基占比29.63%;
绿色线条或字母代表β转角,共50个氨基酸残基占比6.53%;
紫色线条或黄色字母代表无规卷曲,共350个氨基酸残基占比45.69%。

图6 DPP4的二级结构预测结果

通过NCBI的Blast功能对DPP4蛋白进行序列比对,以分析其所包含的结构域。分析结果显示,DPP4蛋白共包含4个保守结构域,分属四个不同的超家族,它们分别为DPPIV_N结构域、Peptidase_S9结构域、DAP2结构域和DPPIV_rep结构域(见图7)。这些保守结构域的分布几乎占满了DPP4蛋白的整个氨基酸链,推测DPP4蛋白的整体结构是相对保守的。关于这些结构域的分布位置和具体描述(如表2)。因此,DPP4作为一种氨肽酶,其主要的生理活性主要依赖位于第398-763位的酶活性结构域。

图7 DPP4蛋白保守结构域的预测结果

表2 DPP4蛋白保守结构域的描述

DPP4蛋白的三级结构由SWISS-MODEL建模,该软件通过50个模板进行分析,共得到1个匹配的蛋白质三级结构(图8)。该模型的预测范围为第39-766位氨基酸,覆盖率为1.00,其GMQE(全球模型质量估计)为0.90,QMEAN(定性模型能量分析)为0.91±0.05,表明模型可靠性较高。此外,经分析,该蛋白为同源二聚体。图8a为DPP4蛋白的空间结构模型,图中从蓝色到红色表示的是肽链从N端到C端的折叠结果。从图中可以看到,该蛋白的空间结构程中间细两端粗的哑铃形,而两端均为蓝色的N端氨基酸残基,中间最细处则为红色的C端氨基酸残基。图8b为DPP4蛋白模型,图中可以清楚地反映出蛋白质的各种二级结构及其位置,经分析,该模型与SOPMA软件所分析的二级结构较为吻合,二者互为印证。图8c为DPP4蛋白三级结构预测结果的拉氏图,每一个圆点代表一个氨基酸残基,这些不同颜色的圆点与图9b中的氨基酸残基一一对应,它们所处的区域代表了三级结构与这些氨基酸残基的匹配程度,其中绿色区域代表匹配程度偏好,浅绿色区域代表匹配程度较好,浅灰色区域代表匹配程度尚可。从图中可以看到,大部分氨基酸残基都落在绿色和浅绿色区域,因此有理由认为该三级结构的可信度较高。图8d表示DPP4蛋白结构预测结果与各个位点之间的相似度分析结果,图8e表示预测结果与非冗余PDB结构集的比较,图中红色星号表示预测结果所处位置。d、e两图都为三级结构预测结果可靠性的佐证。

(a)DPP4蛋白的空间结构模型;
(b)DPP4蛋白的卡通模型;
(c)DPP4蛋白的三级结构预测结果拉氏图;
(d)预测结果与各位点氨基酸相似度分析结果;
(e)预测结果与非冗余PDB结构集的比较。

2.4 DPP4蛋白翻译后修饰位点的预测结果

翻译后修饰位点的确定有利于分析蛋白质在不同生理或生化过程中的作用及变化规律,包括蛋白糖基化位点和蛋白磷酸化位点。蛋白糖基化位点分为N-糖基化位点和O-糖基化位点,其中N-糖基化位点由NetNGlyc 1.0 Sever进行分析(图9)。DPP4共有9个N-糖基化位点,分别为85位N(0.6878)、92位N(0.6603)、150位N(0.6526)、219位N(0.5259)、229位N(0.5908)、263位N(0.8064)、281位N(0.6590)、321位N(0.6873)、520位N(0.6908),根据软件的评审意见,第85、92、263、321位应被认定为最有可能的蛋白N-糖基化位点,但是第263位天冬酰胺残基之后出现了脯氨酸,这样的构象限制使得天冬酰胺不太可能被糖基化,因此该位点也应被排除。O-糖基化位点由NetOGlyc 4.0 Server和YinOYang 1.2 Server两个软件共同预测,其中,NetOGlyc 4.0 Server预测到7个得分超过0.5的位点,分别为32位T(0.580817)、39位S(0.618924)、42位T(0.797068)、44位T(0.802528)、251位T(0.500000)、284位S(0.648953)、350位T(0.640132);
YinOYang 1.2 Server预测到7个超过阈值线的位点,分别为156位T(0.5346)、251位T(0.4928)、273位T(0.5138)、280位T(0.6942)、333位S(0.4368)、637位S(0.5580)、657位S(0.6129)(图10)。两个软件共预测出13个可能的蛋白O-糖基化位点,其中251位T被两个软件同时命中。丝氨酸(S)、苏氨酸(T)、酪氨酸(Y)均有可能成为蛋白质的磷酸化位点,这一结果由Netphos 3.1 Server软件进行预测(图11)。由于所命中的高于阈值线(0.5)的位点过多,因此选取19个得分高于0.9的位点记录如下:39位S(0.957)、64位S(0.944)、101位S(0.983)、127位S(0.996)、166位Y(0.915)、173位Y(0.983)、188位T(0.935)、278位S(0.985)、312位S(0.992)、323位S(0.972)、334位S(0.981)、376位S(0.983)、381位Y(0.952)、462位S(0.957)、537位S(0.961)、583位S(0.994)、614位S(0.912)、662位Y(0.946)、686位S(0.925),这些位点的得分较高,因此它们成为蛋白磷酸化位点的置信度也较高。

图9 DPP4的N-糖基化位点预测结果

图10 DPP4的O-糖基化位点预测结果

图11 DPP4的磷酸化位点预测结果

2.5 DPP4相关蛋白的相互作用预测结果

分析蛋白质在生理或生化过程中的功能及调控机制,需要对其与相关蛋白的相互作用进行了解。在设置最高置信度(0.9)且相关蛋白不超过10个后,STRING软件对DPP4的相关蛋白相互作用关系网络预测。分析得到与DPP4产生相互作用的6个蛋白质,分别为ACE2(血管紧张素转换酶2,得分0.942)、ADA(腺苷脱氨酶,得分0.918)、GCG(胰高血糖素,得分0.994)、GIP(胃抑制多肽,得分0.993)、INS(胰岛素,得分0.942)、MME(脑啡肽酶,得分0.928)(图12)。

图12 DPP4相关蛋白的相互作用

同时,STRING软件对DPP4参与的各种生物活动进行了综合分析。基因本体(GO)数据库的分析中,DPP4蛋白参与的生物过程较多,选取具有代表性的10项生物过程(表3)。从表中可知该蛋白主要参与血管紧张素的调节、糖代谢、炎性反应、介导病毒侵袭宿主等。DPP4参与的GO分子功能共有9项,主要涉及病毒受体活性、激素活性、钠离子结合以及各种酶活性等功能(表4)。KEGG通路分析中,DPP4共参与3条代谢通路,分别为肾素-血管紧张素系统、胰岛素分泌、蛋白质消化吸收(表5)。

表3 DPP4参与的GO生物过程

表4 DPP4参与的分子功能

表5 DPP4参与的信号通路

2.6 DPP4蛋白系统进化树的构建

在研究SARS-CoV-2侵入宿主细胞的过程和机理时,应采用DPP4蛋白亲缘性与人类最高的物种,而通过构建系统进化树就可以直观地反映出不同物种之间同类蛋白的亲缘关系。在NCBI-Protein数据库中下载得到人、小家鼠、黑猩猩、牛、北美鼠兔等15个物种的DPP4蛋白氨基酸序列,在MEGA X软件中首先通过Clustal W进行序列比对,再以Neighbor-Joining算法进行系统进化树的构建(图13)。分析结果表明,人类的DPP4蛋白与灵长类动物如黑猩猩、东非狒狒等的亲缘关系最近,其次与北美鼠兔、普氏野马、牛等物种的亲缘关系较近,而与啮齿类动物如小家鼠、褐家鼠等的亲缘关系较远。因此在研究SARS-CoV-2侵入宿主细胞中DPP4蛋白的作用时,不应使用小鼠作为模型动物,而应选择与人属关系更近的动物进行实验研究。

图13 DPP4在不同物种间的系统进化树

DPP4作为防治病毒性肺炎中连花清瘟胶囊在体内的重要靶点,无论是在病毒侵入宿主细胞的机理,还是在连花清瘟胶囊防治功效的研究中,都是一个备受关注的重要环节。本研究通过生物信息学手段,深入细致预测并分析了DPP4基因及蛋白的相关信息。预测结果显示,DPP4是一个亲水性非经典分泌蛋白,具有一个跨膜结构,并在小肠中表达较为丰富,亚细胞分布研究表明其主要分布在内质网。DPP4蛋白的翻译后修饰位点较多,预测到第85、92、321位的三个置信度较高的蛋白N-糖基化位点,13个可能的蛋白O-糖基化位点,以及19个置信度很高的蛋白磷酸化位点。丰富的修饰位点不仅提示蛋白质具有复杂的生理功能,也为研究者开发相对专一的靶向药物提供了更多的角度。

对DPP4蛋白保守结构域的预测结果中发现:DPP4蛋白具有酶活性的保守结构域位于C端一侧,而N端的保守结构域具有非酶的其他活性功能,因此在研发针对DPP4蛋白的抑制剂时,应着眼于破坏其C端结构。有趣的是,通过预测并分析DPP4蛋白的三级结构后,发现其空间构象为哑铃形,而且哑铃的两端是N端氨基酸残基折叠成的膨大结构,中间则是C端氨基酸残基折叠成的纤细结构,这样的奇特构象虽然可以通过两端的结构将中间的酶活性部位保护起来,但是如果设计一种卡子化合物,通过空间构象的靶向性与DPP4蛋白产生特异性结合,并切断中间的酶活性单元,即可高效且专一地抑制DPP4蛋白的活性。蛋白相互作用预测显示,DPP4与ACE2具有较高置信度的相互作用关系。当前研究认为,SARS-CoV-2侵袭宿主细胞主要依赖于刺突蛋白(S蛋白)与宿主细胞ACE2的结合,因此ACE2是人们研究防治病毒性肺炎方法的一个重要突破点。GO分析显示,DPP4参与了病毒侵入宿主细胞的生物过程,而且具有表达病毒受体活性的分子功能,因此DPP4也将是SARS-CoV-2结合ACE2并侵入宿主的关键环节。已有研究猜测,ACE2-TMPRSS2-Furin-DPP4轴可能正是SARS-CoV-2侵袭宿主细胞的转导路径[24],本文研究为这样的猜测提供了有力的佐证。此外,GO和KEGG分析还指出了DPP4在调节糖代谢和介导炎性反应中的重要作用。如前文所述,研究者们为患者加用DPP4抑制剂后均取得了较为满意的效果,成功阻止了患者肺部持续的细胞因子风暴,降低了2型糖尿病患者由于慢性高糖带来的炎性反应,可谓一举多得。由于连花清瘟胶囊对DPP4同样具有明确的靶向作用,因此该药对病毒性肺炎的防治效果是可靠且具有明确依据的。

目前,随着传染性更强、毒力更大的变异毒株的出现,开发特效的治疗药物将是研究者们很长一段时间内的奋斗目标。本文通过对DPP4进行深入且系统地分析,更加全面地阐述了连花清瘟胶囊在防治病毒性肺炎的其中一条通路的原理,为中药现代化研究提供了可靠的研究角度,对相关抑制剂的研发具有参考意义。

猜你喜欢残基糖基化结构域基于各向异性网络模型研究δ阿片受体的动力学与关键残基*生物化学与生物物理进展(2022年6期)2022-07-21糖基化燕麦分离蛋白制备的工艺优化研究现代畜牧科技(2021年6期)2021-07-16“残基片段和排列组合法”在书写限制条件的同分异构体中的应用中学生数理化(高中版.高考理化)(2021年2期)2021-03-19蛋白质结构域划分方法及在线服务综述广州大学学报(自然科学版)(2019年1期)2019-05-07重组绿豆BBI(6-33)结构域的抗肿瘤作用分析天津科技大学学报(2016年1期)2016-02-28组蛋白甲基化酶Set2片段调控SET结构域催化活性的探讨湖北师范大学学报(自然科学版)(2015年2期)2016-01-10蛋白质二级结构序列与残基种类间关联的分析池州学院学报(2015年3期)2016-01-05基于支持向量机的蛋白质相互作用界面热点残基预测天津科技大学学报(2015年2期)2015-08-09糖基化终末产物与冠脉舒张功能受损医学研究杂志(2015年12期)2015-06-10泛素结合结构域与泛素化信号的识别现代检验医学杂志(2015年2期)2015-02-06

推荐访问:胶囊 信息学 防治

本文来源:http://www.zhangdahai.com/shiyongfanwen/qitafanwen/2023/0917/655655.html

  • 相关内容
  • 热门专题
  • 网站地图- 手机版
  • Copyright @ www.zhangdahai.com 大海范文网 All Rights Reserved 黔ICP备2021006551号
  • 免责声明:大海范文网部分信息来自互联网,并不带表本站观点!若侵害了您的利益,请联系我们,我们将在48小时内删除!